数据科学负责人 - 这是一个远程工作的机会。我们自动获取传入的文档、电子邮件和附件。我们是一家快速发展的初创公司。我们正在招聘一名数据科学负责人,以推动我们平台上的应用机器学习和生成式AI计划,同时领导和发展我们的数据科学团队。对于能够战略性思考、管理和指导团队,并仍然亲自参与构建和评估生产级模型并与工程和产品紧密合作以交付可衡量成果的人来说,这是一个高影响力的角色。您将专注于文档AI,包括单元化、分类和提取,并将负责我们的模型监控和评估框架,确保我们在生产中提供世界级的准确性、可扩展性和可靠性。
您的工作内容:
- 领导关于文档理解模型、单元化、分类、信息提取和混合(LLM + 传统ML)架构的应用研究和实验。
- 与位于印度的数据科学团队合作,设计、评估和部署模型策略。
- 与美国的产品、客户成功和实施团队合作,将业务需求转化为数据驱动的解决方案和可衡量的KPI。
- 开发和改进模型监控和评估管道,以提高准确性、漂移检测和成本性能权衡。
- 探索和基准测试商业和开源模型(OpenAI、Anthropic、Claude、Mistral、Hugging Face等)用于文档AI用例。
- 设计数据采样和反馈策略(例如,黄金数据集、主动学习、微调数据集)以持续提高模型性能。
- 开发可扩展的实验、A/B测试和提示优化框架。
您需要具备的条件:
- 5年以上应用数据科学/ML经验,其中至少2年以上NLP或文档AI经验。
- 熟练掌握Python、PyTorch/TensorFlow、Hugging Face、OpenAI/Anthropic API和向量数据库(Qdrant、pgvector、Pinecone)。
- 深厚的文档分类、实体提取、嵌入和文本相似性经验。
- 在LLM提示工程、微调和评估框架方面有丰富经验。
- 具有MLOps/模型评估管道(MLflow、Weights & Biases、LangFuse或同等工具)经验。
- 熟悉SQL和数据建模(PostgreSQL、RDS等)。
- 之前在多模态(图像和文本)文档管道或基于OCR的数据提取方面的工作经验。
- 具有主动学习、RLHF或自动验证框架经验。
- 熟悉AWS(EKS、SageMaker、Bedrock)和容器化模型部署。
- 之前在远程优先或跨境团队环境中工作的经验。
- 在受监管行业的背景。
为什么选择我们:
- 成为美国的第一位数据科学家,奠定未来增长的基础。
- 在大规模的生成式AI和文档AI问题上工作。
- 与跨大陆的领导层直接合作。
- 为美国各地企业每天使用的产品做出贡献。
- 高度的所有权、自主性和可衡量的影响机会。
- 对于此职位,您必须目前被授权在美国工作,无需非移民签证的赞助。
CyberCoders将根据洛杉矶公平机会招聘倡议(禁止询问犯罪记录)条例的要求,考虑在洛杉矶市有犯罪记录的合格申请人。此职位由CyberCoders于2026年1月14日首次发布,申请将持续接受,直到职位被填满或关闭。CyberCoders自豪地成为一个平等机会雇主。
所有合格的申请人将在不考虑种族、肤色、宗教、性别、年龄、性取向、性别认同或表达、国籍、祖先、公民身份、遗传信息、注册的国内伴侣身份、婚姻状况、犯罪受害者身份、残疾、受保护的退伍军人身份或任何其他受法律保护的特征的情况下获得就业考虑。我们的招聘流程包括AI关键词筛选和最低资格要求。招聘人员会审核所有结果。CyberCoders将根据适用的州和地方法律的要求,包括但不限于洛杉矶县公平机会条例、旧金山公平机会条例和加州公平机会法,考虑有犯罪记录的合格申请人。CyberCoders致力于与身体和精神残疾人士合作并为其提供合理的便利。需要特别帮助或在求职过程中需要便利的人士可以通过Benefits@CyberCoders.com联系我们的人力资源团队成员进行安排。