公司简介加入Turnitin，您将进入一家在全球教育领域被公认为创新者的公司。超过25年来，Turnitin一直与教育机构合作，促进各学科和评估类型的诚信、一致性和公平性。教育机构、认证和许可项目使用Turnitin的产品来维护诚信并提高学习表现，学生和专业人士则使用这些产品来完成他们最好的原创作品。体验以远程为主的文化，这种文化使您能够以最适合您的方式工作，赋予您目标感和责任感，并由优先考虑您整体健康的综合方案支持。我们多元化的同事社区都因共同的愿望而团结在一起，那就是在教育领域有所作为。 Turnitin是一家全球性组织，团队成员遍布包括美国、墨西哥、英国、澳大利亚、日本、印度和菲律宾在内的35个以上的国家。职位描述机器学习是我们公司持续成功的关键。我们的产品路线图令人兴奋且雄心勃勃。您将加入一个由好奇、乐于助人且独立的科学家和工程师组成的全球团队，他们致力于交付尖端且工程良好的机器学习系统。您将与Turnitin的产品和工程团队紧密合作，将机器学习整合到广泛的学习、教学和诚信产品中。我们处于一个独特的位置，可以提供由全球数十万教师使用的机器学习，教授数百万学生。您的贡献将具有全球影响力和规模。数十亿篇论文已提交到Turnitin平台，数亿个答案已在Gradescope和Examsoft平台上被评分。机器学习为我们的AI写作检测系统提供动力，自动反馈学生写作，调查学生写作的作者身份，革新评估的创建和评分，并在许多后端流程中发挥关键作用。职责和要求我们是一个倾向于现代深度学习的应用科学小组。我们期望高级机器学习科学家在（深度）机器学习的科学和软件工程方面具备平衡的技能。您将专注于开发新颖且可部署的机器学习模型和解决方案，在没有现成解决方案的情况下。因此，您需要对机器学习和深度神经网络的数学有足够的了解，以便构建新颖的模型架构、损失函数、训练方法、训练循环等。您还需跟上AI和深度学习在各个领域的最新研究进展，并将其应用于您的工作。虽然我们利用现成的训练平台，但我们也编写自己的训练循环。此外，模型需要能够直接部署到我们的产品中，因此需要具备生产级别的编码和软件工程能力。您可能需要训练大型模型（高达数百亿参数），因此需要具备在多个GPU和节点上训练的能力，并了解最新的模型训练和推理进展。接下来，模型在生产中不仅要在准确性方面表现良好，还要在计算成本方面表现良好。交付此类软件需要足够深入的计算机科学背景。数据集的探索、生成（合成）、设计、构建和分析是工作的一部分，可能占用您相当一部分时间。此外，数据集可能很大（数十亿样本），因此编写并行和高效的管道是必要的技能。您还将参与开发和展示演示，并通过同行评审的场合（最好是A/A+级）发表您的工作。日常职责包括： - 研究和开发如上所述的机器学习模型。优化模型以适应大规模生产使用。 - 与AI团队的同事、其他工程团队、主题专家、产品管理、市场营销、销售和客户支持合作，探索持续的产品问题、挑战和机会，然后推荐创新的ML/AI解决方案。 - 作为AI团队的一员，帮助处理临时的一次性任务。 - 与主题专家合作，策划和生成最佳数据集，遵循负责任的数据收集和模型维护实践。探索和访问本地数据存储以及网络数据，并编写高效的并行管道。审查和设计数据集以确保数据质量。 - 调查生产中模型的弱点并提出务实的解决方案。 - 修改和微调现成的模型或开发新模型。通过API（通过提示工程和代理）和本地托管的LLM及其他基础模型使用LLM。 - 在该领域保持最新状态——阅读研究论文，尝试新架构和方法，并分享您的发现。 - 编写干净、高效和模块化的代码，附带自动化测试和适当的文档。 - 跟上技术和平台的最新进展，做出良好的技术选择，并能够向组织解释这些选择。 - 与下游团队合作，将您的工作投入生产并确保其进入产品发布。 - 向同行、主题专家和产品负责人传达见解以及模型的行为和限制。 - 展示和发表您的工作。资格 - 计算机科学、电气工程、AI、机器学习、应用数学或相关领域的硕士或博士学位，或在深度机器学习、计算机科学和软件工程方面表现卓越的杰出成就。 - 至少10年机器/深度学习（我们使用python生态系统进行ML）、计算机科学和软件工程的行业经验。 - 对机器学习和深度学习背后的数学和理论有深入理解是先决条件。 - 在与机器学习相关的同行评审会议或期刊上发表的学术论文——最好是A/A+级，如NeurIPS、ICML、ICLR、AAAI、TMLR、JMLR、IJCAI、ICANN、KDD、ACL、EMNLP、NAACL、COLING、CVPR、ICCV、ECCV、IEEE等。 - 机器/深度学习开发技能，包括流行平台（我们使用AWS SageMaker、Hugging Face、Transformers、PyTorch、PyTorch Lightning、Ray、scikit-learn、Jupyter、Weights & Biases等）。 - 对语言模型的理解，使用和训练/微调，并熟悉行业标准的LM系列。 - 出色的沟通和团队合作能力。 - 流利的英语书写和口语能力。加分项 - 我们是应用科学小组（而非基础研究），因此软件开发能力是必需的。 - 有使用文本数据构建深度学习和机器学习模型的经验，包括监督和无监督。具有其他模式（如视觉和语音）深度学习经验将是一个强大的加分项。 - 偏好计算机科学教育背景，而非统计或纯数学。 - 强化学习。 - 深度神经网络的可解释性。 - 具有高级提示/代理系统和微调或训练LLM的经验，使用行业认可的平台。 - 展示以前的工作（例如，通过网站、演示、开源代码）。 - 熟悉构建前端（Gradio、Streamlit、Dash或更标准的React、Javascript、Flask）用于简单演示、POC和原型。 - 基本的开发运维技能（我们使用Docker、AWS EC2/Batch/Lambda）。 - 熟悉大规模生产的编码。附加信息该职位的预期年基本工资范围为：$147,300/年到$245,000/年。该职位有资格获得奖金/佣金。实际薪酬将在提供时以书面形式提供，并由工作地点和其他相关因素决定，包括但不限于：经验、技能、学位、执照、认证和其他与工作相关的因素。内部公平性、市场和组织因素也会被考虑。 Turnitin的全面奖励在Turnitin，我们相信全面的奖励远不止于薪酬。虽然工资、奖金或佣金很重要，但它们只是您为工作所获得价值的一部分。除了薪酬之外，您还将体验释放潜力和对全球教育产生积极影响的内在奖励。您还将在一个没有政治的文化中蓬勃发展，周围是谦逊、包容和合作的团队成员。此外，我们的外在奖励包括慷慨的休假和健康计划，提供选择、灵活性和生活挑战的安全网。您还将享受以远程为主的文化，使您能够以最适合您的方式工作，赋予您目标感和责任感，并由优先考虑您整体健康的综合方案支持。我们的使命是确保全球教育的诚信并显著改善学习成果。我们的价值观是我们所做一切的基础。 - 以客户为中心：我们的使命是改善学习成果；我们通过将教育者和学习者置于我们所做一切的中心来实现这一目标。 - 对学习的热情：我们致力于我们内部的学习和成长。我们支持全球的教育和学习。 - 诚信：诚信是Turnitin的核心——它是我们产品的核心，是我们对待彼此的方式，也是我们与客户和供应商合作的方式。 - 行动与责任：我们偏向于行动。我们像主人一样行动。即使很难，我们也愿意改变。 - 一个团队：我们努力打破孤岛，有效合作，并庆祝彼此的成功。 - 全球思维：我们考虑不同的观点并庆祝多样性。我们是一个团队。我们的工作对世界产生影响。全球福利 - 远程优先文化 - 医疗保险 - 教育报销*有竞争力的带薪休假 - 自我护理日 - 国家假日 - 2个创始人日+六月节观察 - 带薪志愿者休假 - 慈善捐款匹配 - 每月健康或家庭办公室报销 - 员工援助计划（心理健康平台）的访问 - 育儿假 - 带匹配/贡献的退休计划超越职位广告在Turnitin，我们认识到候选人不可能满足职位广告中的100%标准。如果您符合大多数要求，我们鼓励您申请，因为我们知道技能会随着时间的推移而发展。如果您愿意与我们一起学习并释放您的潜力，欢迎加入我们的团队！ Turnitin, LLC是一个平等机会雇主——退伍军人/残疾人。

首席机器学习科学家（美国远程）

Turnitin, LLC