职位名称:数据工程师 - pytorch, scikit-learn
工作地点:纽约,纽约(混合办公)
工作类型:全职
预计开始日期:尽快
职位描述:
必须精通Python,特别是在机器学习管道中使用Py torch和scikit-learn。
需要具备AWS经验,能够在AWS中构建管道。
应具备LLM(langchain、代理、广泛的提示工程)背景。
以下“强附加要求”是必需的。
职责:
• 吸收、结构化和分析各种非结构化数据源。
• 在AWS环境中设计、维护和协调数据管道,以进行生产处理和培训流程。
• 持续评估、分析、测试和改进我们数据系统的质量、隐私和性能。
• 在产品各个方面做出贡献,包括前端用户体验和产品设计、API/系统架构以及机器学习处理/培训。
最低资格:
• 3年以上吸收、分析和结构化各种数据源的经验。
• 在生产环境中构建和维护数据管道的丰富经验。
• 扎实的数据库/SQL、Python、Pandas(或同等工具)经验。
• 之前在快节奏环境中工作,并快速迭代解决跨堆栈问题的经验,同时保持高质量标准。
强附加资格:
• 丰富的医疗数据经验。
• LLM经验(langchain、代理、广泛的提示工程)。
• MLE经验 - pytorch、scikit-learn等。
• 广泛的生产AWS、容器和/或数据编排经验。
• 全栈开发经验(尤其是JS/TS/Node)。