AWS MLOps(机器学习运维)工程师

14个月前全职
Tata Consultancy Services

Tata Consultancy Services

location 悉尼
unsaved
关于TCS: 加入塔塔咨询服务公司(Tata Consultancy Services,简称TCS),成为一个致力于可持续发展的组织的一部分。TCS秉承塔塔集团的理念,建立根植于社区并关心环境的可持续业务。我们独特的价值观使我们能够将以目标为驱动的世界观与数字创新相结合,与客户、社区和政府合作,引领和塑造可持续未来的创新解决方案。自2022年起,TCS在亚太地区的11个国家、12个交付中心和18个办公室的运营已经实现了碳中和。这只是TCS旅程的初步阶段,我们努力实现2030年的长期净零排放目标。 企业可持续性已融入我们的三重底线,关注人民、地球和我们的使命。我们的办公室设计具有环保特点,可以显著减少我们的碳足迹并提高能源效率。我们积极倡导绿色倡议,例如推广无纸化运营、实施节能措施,并促进员工参与可持续发展工作。当您成为TCS大家庭的一员时,您将在创新、卓越和共同塑造更加美好、更加绿色的未来的任务中发挥重要作用。加入我们,成为塔塔咨询服务亚太地区通过技术和人才推动可持续发展的使命的一部分。 职位描述: AWS MLOps(机器学习运营)工程师,具有5-6年与AWS个性化(Personalize是一项机器学习服务,可帮助开发人员快速构建和部署具有实时个性化和用户推荐功能的定制推荐引擎)相关经验,负责设计、实施和管理AWS平台上的机器学习基础设施和工作流程。 以下是AWS MLOps工程师的基本工作设计概述: • 基础设施设置:设计和部署适用于机器学习工作负载的AWS基础设施组件,如EC2实例、S3存储桶、VPC和网络配置。 • 自动化模型部署:使用AWS服务(如SageMaker、AWS Lambda和AWS Batch)开发模型训练、评估和部署的自动化流程。 • 监控和优化:实施监控解决方案,跟踪模型性能、资源利用和整体系统健康状况。使用AWS CloudWatch、AWS X-Ray或自定义监控工具。 • 安全和合规:按照AWS最佳实践和行业标准,通过实施加密、访问控制和合规措施,确保数据和模型的安全性。 • 协作和文档化:与数据科学家、工程师和利益相关者合作,简化工作流程、记录过程并分享最佳实践。 • 成本优化:利用AWS成本管理工具和策略,优化成本,例如选择合适的实例类型和高效扩展资源。 • 持续集成/持续部署(CI/CD):通过Terraform建立CI/CD流水线,用于ML模型的自动化测试、验证和部署。 • 故障排除和支持:诊断和解决与基础设施、部署或性能相关的问题,确保运营顺畅。 • 采用新技术:及时了解最新的AWS服务和机器学习框架,提出并实施现有基础设施和流程的改进。 • 文档和培训:记录流程、最佳实践,并创建培训资料,促进知识传递并帮助团队成员。 这个角色需要对AWS服务、机器学习概念、编程技能和DevOps实践有深入的理解,以在AWS云上有效地管理和优化机器学习生命周期。 TCS是一个平等机会的雇主,我们积极推广性别多样性,并鼓励合格的女性候选人申请,营造一个包容的工作环境文化。