软件工程师 - 数据与机器学习基础设施

多伦多 19天前全职 网络
62.4万 - 93.6万 / 年
在 AMD 工作改变一切 在 AMD,我们的使命是构建出色的产品,以加速下一代计算体验——从人工智能和数据中心,到个人电脑、游戏和嵌入式系统。我们扎根于创新与合作的文化中,相信真正的进步来自大胆的想法、人类的智慧以及共同创造非凡事物的热情。当你加入 AMD 时,你会发现真正的区别在于我们的文化。我们推动创新的极限,以解决世界上最重要的挑战——追求卓越的执行,同时保持直接、谦逊、合作,并包容多样的观点。加入我们,共同塑造人工智能及更远的未来。让我们一起推动你的职业发展。 角色 我们正在寻找一位经验丰富的软件工程师,热衷于数据基础设施、自动化和应用机器学习。 这个角色对于构建 AMD 下一代数据管道和分析基础设施以支持 AI 工作负载和 GPU 验证至关重要。 你将设计和实现可扩展的高性能数据系统,以收集、处理和分析 GPU 监测、性能和功耗数据。 你将与固件、软件和基础设施团队密切合作,将原始数据转化为可操作的见解和预测性智能。 个人要求 你对软件开发充满热情,具备创造性和有效的问题解决能力,是一位积极主动的自我启动者,能够在快节奏的环境中独立和协作工作。你拥有出色的技术沟通、人际交往和领导能力。 主要职责 • 设计、开发和维护可扩展的数据管道,用于收集、预处理、转换和存储大规模的 GPU 和系统监测数据。 • 架构数据模型和 ETL 过程,处理 SQL/NoSQL 生态系统中的结构化和非结构化数据。 • 将基于机器学习的分析(例如,异常检测、性能预测、功率效率建模)集成到生产管道中。 • 与多个工程团队合作,利用真实的 GPU 数据实现模型训练、评估和部署工作流。 所需技能 • 精通 Python,具备生产级数据管道经验。 • 扎实理解数据库(SQL 和 NoSQL)和分布式数据系统(例如,PostgreSQL、MongoDB、Kafka 或 Databricks)。 • 具备 ETL 框架和编排工具(例如,Airflow、Prefect 或 Luigi)的实践经验。 • 熟悉机器学习框架,如 PyTorch、Scikit-learn 或 TensorFlow,用于应用数据分析和预测建模。 • 具备数据可视化和报告工具(例如,Grafana、PowerBI)的经验者优先。 • 有使用基于云的存储和计算服务(例如,Azure、AWS 或 GCP)的经验。 优先经验 • 硬件监测、性能或 GPU 分析背景。 • 具备构建 AI 驱动的自动化系统或数据驱动决策框架的经验。 • 熟悉容器化环境(Docker、Kubernetes)和 CI/CD 工作流。 学术资格 • 计算机科学、工程、数学、数据工程或类似专业的学士/硕士学位,重点关注软件工程。 提供的福利:AMD 福利一览。 AMD 不接受猎头、招聘机构或收费招聘服务的主动简历。AMD 及其子公司是平等机会的包容性雇主,将考虑所有申请者,而不考虑年龄、血统、肤色、婚姻状况、医疗状况、精神或身体残疾、国籍、种族、宗教、政治和/或第三方关系、性别、怀孕、性取向、性别认同、军事或退伍军人身份,或任何其他受法律保护的特征。我们鼓励所有合格候选人申请,并将在招聘和选拔过程的各个阶段根据相关法律满足申请者的需求。