你是否曾经想过,世界上最大的电子商务目录是由什么样的系统和软件驱动的?在你知道传统的数据库技术无法处理如此大规模的情况下,你们构建了什么样的系统来托管这样一个目录,并且每天处理数百亿个商品的更新?你们是如何确保向全球数亿亚马逊客户提供24x7x365最新鲜的信息的?欢迎来到高度分布式系统和大规模的世界-亚马逊选择和目录系统(ASCS)!ASCS内的产品分类团队正在通过本体引导的自动分类、机器学习、自动分类和自然语言处理技术来重新定义世界上最大的电子商务目录中的产品分类方式。
产品目录是亚马逊的战略资产。
它提供了无与伦比的产品发现功能,为客户购买决策提供了信息,并在各个类别上提供了大量的选择,使亚马逊成为在线购物的首选。
作为亚马逊选择和目录组织的高级应用科学家,您将帮助我们使世界上最好的产品目录变得更好,并改善数百万客户的体验。
您将有机会设计在其他地方很少有的规模的新分类工作流程,利用Spark、Python和TensorFlow等最先进的数据科学和机器学习工具,以及亚马逊的云计算技术,如弹性Map Reduce(EMR)、Kinesis和Redshift。
您将运用您对数据科学的知识,创建算法解决方案,将聚类、模式挖掘、预测建模、深度学习、信息检索和自然语言处理等技术结合起来,应用于描述目录中产品和客户互动的海量数据。
您将以科学严谨的方法评估并为业务战略和技术方向提供输入。
您将与软件工程团队合作,将您的算法解决方案整合到大规模复杂的亚马逊生产系统中。
您将面临许多挑战,包括规模(构建数十亿个产品的模型,利用数万亿次客户互动),准确性(由于错误的影响,如合并相同产品的极高精度要求或召回要求),速度(为数百万个新产品或更改产品生成预测,延迟低),多样性(产品需要在16种语言中被分类到数千个类别中),高维度(使用数千个结构化产品特征和数百万个值、非结构化产品数据、产品图片、客户搜索、点击、评论等进行特征工程和选择),以及噪声(构建对数百万卖家提供的数据质量变化和隐式或人工收集的标签具有鲁棒性的模型,例如备用拼写)。
您需要有创造力,超越教科书解决方案,应对这些挑战。
满足业务需求将涉及将几种不同的机器学习算法与领域知识结合到复杂的数据分析工作流中,自动化可以自动化的内容,并在需要时高效利用专家以减轻风险。
您的解决方案将直接影响客户体验,使产品易于发现,在正确的位置呈现,并提供完整准确的产品信息,以便做出知情的购买决策。
。
预计薪资:根据资格每小时20至28美元。