职位: 数据工程师 - 人工智能与机器学习
工作地点: 加州湾区
职责:
1. 开发 AI/ML 模型:
• 设计、构建和训练机器学习模型,使用适当的算法(例如,监督学习、无监督学习、强化学习、深度学习)。
• 使用各种机器学习和 AI 框架(如 TensorFlow、PyTorch、Scikit-learn、Keras 等)来实现模型。
• 尝试不同的方法(例如,决策树、神经网络、集成方法),并优化以获得最佳性能。
• 使用真实数据进行模型选择、训练、调优和验证,以实现最准确的结果。
2. 数据准备与特征工程:
• 清理、预处理和结构化原始数据以进行分析,确保其适合模型训练。
• 实施数据增强技术,处理缺失数据并去除异常值。
• 工程特征以改善模型性能,理解数据的潜在关系。
3. 算法设计与优化:
• 为特定用例(如图像识别、自然语言处理(NLP)、语音识别或推荐系统)开发和优化算法。
• 优化算法以实现高效性、可扩展性和实时性能。
• 定期评估和提高模型准确性,通过实验不同的超参数、架构和优化技术。
4. 部署机器学习模型:
• 与软件工程师合作,将机器学习模型部署到生产环境中,与现有系统集成。
• 确保模型可扩展、高效,并能够根据需要处理实时或批量数据。
• 实施模型监控和性能跟踪工具,以评估准确性并检测模型漂移。
5. 模型评估与测试:
• 使用交叉验证和其他技术评估模型的泛化能力。
• 实施性能指标以测量模型准确性、精确度、召回率、F1 分数及其他与项目需求相关的指标。
• 进行 A/B 测试并比较多个模型的性能。
6. 持续改进与研究:
• 了解最新的 AI/ML 研究和领域进展,如新算法、架构和技术。
• 参与代码审查并为 AI/ML 开发的最佳实践做出贡献。
• 尝试新的 AI 和机器学习技术,以不断提高性能并解决复杂问题。
7. 协作与沟通:
• 与数据科学家、软件工程师、产品经理和其他利益相关者密切合作,理解业务问题并将其转化为机器学习任务。
• 以清晰易懂的方式向非技术利益相关者传达发现、见解和进展。
• 在项目上进行协作,为 AI/ML 概念提供专业知识,以帮助塑造产品特性或解决方案。
8. 伦理考虑与偏见缓解:
• 确保模型和算法没有偏见且具有伦理性,尤其是在处理敏感数据时。
• 评估模型的公平性、透明性和可解释性,特别是在医疗、金融和法律等关键应用中。
9. 文档记录:
• 记录模型构建过程、算法选择和使用的数据,确保可重复性和透明性。
• 撰写清晰的技术文档和用户指南,以促进协作和知识转移。
10. 创新与原型开发:
• 原型 AI 驱动的解决方案,以展示其潜力和可行性。
• 为新兴的 AI 和 ML 技术(例如,联邦学习、强化学习、生成模型)开发概念验证(PoCs)和新算法。
资格:
1. 教育背景:
计算机科学、数据科学、人工智能、数学或相关领域的学士或硕士学位。
相关领域的博士学位为加分项,但不是必需的。
2. 技术技能:
• 精通 Python、R 或类似语言的编程技能,用于机器学习和数据分析。
• 深入了解机器学习库,如 TensorFlow、PyTorch、Scikit-learn、Keras 和 XGBoost。
• 扎实的线性代数、概率、统计和优化技术基础。
• 熟练掌握算法和数据结构。
• 具备深度学习技术的经验,包括卷积神经网络(CNN)、递归神经网络(RNN)、变压器和强化学习。
• 熟悉 NLP 技术、计算机视觉、时间序列分析和其他 AI 子领域。
• 了解数据预处理、特征提取和特征选择技术。
• 熟练使用云平台(AWS、Azure、Google Cloud)进行模型训练和部署。
• 熟悉容器化和编排工具(如 Docker、Kubernetes)为加分项。
• 熟悉大数据技术(Hadoop、Spark 等)为加分项。
3. 软技能:
• 强大的问题解决和分析能力。
• 能够在协作的跨职能环境中工作。
• 有效的沟通能力,能够向非技术利益相关者解释复杂的 AI/ML 概念。
• 注重细节,能够排查和调试代码。
• 对持续学习充满热情,保持对 AI 和 ML 进展的关注。
4. 经验:
• 在生产环境中开发和部署机器学习或 AI 模型的证明经验(3 年以上)。
• 熟悉 MLOps(机器学习操作)原则,如模型版本控制、ML 的 CI/CD 流水线和生产中的模型监控。
5. 优先资格:
• 具备强化学习、无监督学习或生成模型(例如,GANs)的经验。
• 了解 AI 伦理,如缓解偏见和确保模型的公平性。
• 熟悉 NLP 库,如 SpaCy、NLTK、Hugging Face Transformers 等。
• 具备在商业环境中构建和部署 AI 驱动的产品的经验。
• 了解边缘计算和在边缘设备上部署 AI 模型。
6. 工作环境:
• 协作和快速发展的工作环境。
• 有机会与尖端技术合作。
• 支持和充满活力的团队文化。
• 该职位可能需要与多个团队(包括产品、工程和研究小组)合作,以开发和实施 AI/ML 解决方案。