职位:IS高级专家,数据分析与人工智能
部门:Aptar信息系统
地点:Aptar全球
出差期望:最多25%
汇报对象:IS数据与分析总监
主要目的概述
IS高级专家,数据分析与人工智能是我们机器学习项目的关键贡献者,将管理完整的开发生命周期,包括数据预处理、特征工程、模型训练、部署和监控。她/他是机器学习和人工智能领域的主题专家,通过高级技术教育和工作经验获得,能够解释内部或外部问题,并推荐解决方案和最佳实践。她/他将与跨职能团队合作,分析大型数据集,构建预测模型,并优化算法性能。
这个角色提供了与先进技术合作的机会,并与重视协作、持续学习的才华横溢的专业团队合作,在动态、创新的环境中工作。
此职位要求具备机器学习和人工智能算法、编程和数据分析的专业知识,以及较强的问题解决和沟通能力。
在此职位上,她/他将直接向IS业务分析总监汇报。
工作职责:
IS高级专家,数据分析与人工智能在Aptar机器学习和人工智能用例的端到端设计和实施中发挥关键作用,与数据与分析团队和业务紧密合作,识别机器学习和生成式人工智能解决方案的关键发展领域,并拥有强大的端到端解决方案所有权,将产品需求转化为用户界面和后端分布式系统设计,并负责这些设计的实施。
她/他是人工智能领域项目和计划的高级团队成员,并根据其领域的需求与利益相关者进行互动。
协作与利益相关者参与
- 她/他独立且有效
- 她/他利用数据、机器学习和人工智能解决问题,并根据业务目标推荐复杂问题的解决方案
- 她/他影响Aptar的专家利益相关者
- 与数据科学家、软件工程师和业务利益相关者合作,定义问题、需求和目标。
- 与领域专家合作,收集见解以增强模型的相关性和性能。
- 有效地向技术和非技术利益相关者传达发现、结果和建议。
- 参与跨职能讨论,识别业务问题和机器学习解决方案的机会。
数据准备与工程
- 预处理、清理和标准化大型数据集以确保数据质量。
- 进行探索性数据分析以理解模式和分布。
- 工程和选择相关特征以优化模型性能。
- 开发和维护可扩展的数据管道以进行数据摄取、转换和特征工程。
模型开发与优化
- 选择、实施和微调适当的机器学习算法或生成式人工智能模型。
- 训练模型,调整超参数,并优化算法性能。
- 应用高级技术,如迁移学习、集成学习和数据增强。
- 为资源受限环境(如边缘或物联网设备)优化模型。
模型评估与验证
- 使用适当的指标评估模型,并对测试数据集进行验证。
- 进行实验(如A/B测试)以评估模型对业务指标的影响。
- 基准测试不同算法以选择最合适的方法。
部署与监控
- 与软件工程师和DevOps团队合作部署机器学习模型。
- 开发监控系统以跟踪性能、检测异常并实施更新。
- 确保生产环境中的可扩展性、可靠性和性能。
研究与持续学习
- 及时了解机器学习、人工智能框架和工具的进展。
- 探索新方法、算法和框架以改进工作流程。
- 参与专业发展活动,如会议和研讨会。
合规与伦理
- 在处理敏感数据时确保遵守数据隐私和安全法规。
- 实施模型公平性、可解释性和解释性的技术。
- 与数据治理团队合作,遵循伦理准则和监管要求。
文档与最佳实践
- 记录机器学习模型、流程和工作流程以确保可重复性。
- 维护版本控制以跟踪代码和实验的变化。
- 参与开发和维护可重用组件和框架。
指导与知识共享
- 指导初级团队成员并提供技术指导。
- 通过博客文章、开源项目和社区贡献分享知识。
- 参与组织内的知识共享会议。
跨职能协作与集成
- 与数据工程师合作优化数据基础设施和管道。
- 与业务利益相关者合作将机器学习集成到现有系统中。
- 参与构建公司范围的机器学习基础设施。
所需技能和资格
编程技能
- 精通编程语言:Python、Spark、R、Java、SQL。
- 具有实施机器学习算法和模型的经验。
- 熟悉版本控制系统(如Azure DevOps)。
机器学习算法和框架
- 监督学习、无监督学习和强化学习。
- 机器学习库:TensorFlow、PyTorch、scikit-learn、Keras。
- 神经网络、CNN、RNN、GAN。
- AutoML工具。
- 强化学习框架,如OpenAI Gym。
数学和统计专业知识
- 线性代数、微积分、概率和统计学的坚实基础。
- 熟悉贝叶斯统计和概率图模型。
数据处理与分析
- 数据操作库:pandas、NumPy、SQL。
- 数据预处理、特征工程和探索性数据分析。
- 了解处理结构化和非结构化数据(如文本、图像、音频、视频)。
大数据和分布式系统
- 具有大数据技术的经验:
- Apache Spark、分布式计算框架(如Databricks、Dataiku……)
- 了解用于数据存储的云服务(如Azure ADLS、Amazon S3、Google Cloud Storage)。
自然语言处理(NLP)
- 情感分析、命名实体识别、文本摘要。
- 了解用于NLP和文本分析的框架。
优化与模型性能
- 超参数调优技术(如贝叶斯优化)。
- 特征选择和降维。
- 了解异常检测算法。
模型部署与监控
- 专业知识部署模型使用:
- RESTful API、微服务架构。
- 容器化工具(如Docker、Kubernetes)。
- 模型监控和漂移检测技能。
- 了解模型可解释性技术(如SHAP、特征重要性)。
软件工程最佳实践
- 软件测试方法。
- 敏捷和Scrum项目管理方法。
可视化与沟通
- Matplotlib、Plotly、Power BI。
- 有效的沟通技巧,适用于技术和非技术受众。
专业技术
- 图分析和神经网络。
- 时间序列分析和预测(如ARIMA、LSTM、Prophet)。
- 了解联邦学习和差分隐私。
附加技能
- 对持续学习和了解进展的热情。
- 了解机器学习中的伦理考虑和数据隐私。
- 能够在跨职能团队中协作工作。
教育
- 学士学位(基础)
- 核心领域:编程、算法、数据结构和计算机系统。
- 数学:线性代数、微积分、概率和统计。
经验
- 5年以上领导AI/ML项目并推动创新的经验。