描述
这是一位高技能的机器学习工程师,负责设计、构建、部署和扩展支持数据驱动产品和智能系统的机器学习模型。该角色位于数据科学、软件工程和MLOps的交汇处,需要有将模型转化为生产就绪解决方案的丰富实践经验,以及Python或R的编程经验。
主要职责:
设计、开发、训练和优化用于实际应用或用例的机器学习模型。
将业务和产品需求转化为可扩展的ML/AI解决方案。
实施特征工程、模型选择、调优和评估技术。
将机器学习模型开发并部署到具有高可用性和性能的生产环境中。
构建和维护机器学习管道(训练、验证、部署、监控)。
监控模型性能、数据漂移和模型衰减;根据需要重新训练模型。
确保模型符合可靠性、可扩展性和安全性标准。
与数据科学家、产品经理和软件工程师密切合作。
与数据工程团队合作,确保高质量、可靠的数据管道。
参与设计和代码审查,确保工程最佳实践。
优化模型的延迟、吞吐量和成本。
实施实验框架(A/B测试、离线评估)。
应用负责任的AI原则,包括公平性、可解释性和治理(如有需要)。
要求
3-7年以上机器学习或应用AI角色的实践经验。
Python(和/或Java、Scala)的强大编程技能。
对机器学习算法(监督、无监督、深度学习)有扎实的理解。
有使用TensorFlow、PyTorch、Scikit-learn等框架的经验。
有使用Docker、Kubernetes或云ML服务部署模型的经验。
对数据结构、算法和软件工程原则有深入了解。
有在敏捷、跨职能团队中工作的经验。
有云平台(AWS、Azure或GCP)和托管ML服务的经验。
有使用MLOps工具(MLflow、Kubeflow、Airflow、SageMaker、Azure ML)的实践经验。
有大数据技术(Spark、Kafka、Databricks)的经验。
在NLP、计算机视觉或生成AI方面有背景。
具备强大的问题解决和分析思维能力。
以生产为先的思维方式。
数据驱动的决策能力。
高度的协作和沟通技能。