公司:
高通中东信息技术公司(Qualcomm Middle East Information Technology Company LLC)
工作领域:
工程组,工程组 > 软件工程
概述:
关于我们
高通正在推动一个每个人和每个事物都能智能连接的世界。您每天都在与高通提供的产品和技术互动,包括能够双重作为专业级相机和游戏设备的5G智能手机、更智能的车辆和城市,以及制造您最新购买产品的智能互联工厂背后的技术。高通的5G和人工智能创新是连接智能边缘的动力。您会发现我们的技术在多个行业的创新背后和内部,为数十亿人每天提供显著价值。
关于该职位
我们正在寻求一名推理准确性工程师,负责设计、开发和验证大规模部署的深度学习模型的模型准确性。该职位专注于深度准确性分析、调试、准确性评估以及在大型数据中心硬件平台上的推理恢复。您需要具备较强的问题解决能力、出色的Python编程技能和推理管道的实践经验。
主要职责包括:
• 定义并实施各精度模式下的准确性KPI
• 开发可扩展的基于Python的准确性评估工具和自动化管道。
• 为推理框架(TensorRT、ONNX Runtime、AITemplate、Triton)实施保持准确性的优化。
• 构建并维护多个框架(ONNX、TensorFlow、PyTorch)下的准确性评估自动化管道。
• 开发用于预处理、后处理和指标评估的可重用插件。
• 对大规模模型(LLMs、视觉、扩散)执行全面的准确性测试。
• 在各种量化和精度设置(FP32、FP16、INT8)下验证准确性。
• 通过深入理解模型架构(包括层、注意机制和参数配置)进行准确性分析。
• 识别由架构驱动的准确性下降趋势并提出优化策略。
• 识别与预处理漂移、标记化不匹配、操作符回退和量化效应相关的问题。
• 分析不同硬件目标、固件版本和运行时后端之间的准确性差异。
• 执行基于切片的准确性分析(批量大小、并发、序列长度、领域转移)。
• 设计并运行实验以恢复准确性,包括微调、校准和超参数调整。
• 通过追踪数据预处理、模型层、量化步骤和部署管道中的根本原因来调试准确性失败。
• 比较不同硬件/软件堆栈之间的结果并生成可行的见解。
• 记录工作流程,维护仪表板,并向利益相关者发布准确性结果。
所需技能与经验:
• 在人工智能/机器学习模型评估和准确性指标方面有扎实的背景。
• 对模型架构(变换器、CNN、RNN、MoE)及其对准确性的影响有深入理解。
• 具有大语言模型(LLMs)和生成式人工智能准确性验证的经验。
• 精通推理运行时(TensorRT、ONNX Runtime、Triton)。
• 理解量化(INT8/FP8/INT4)、校准、QAT和准确性权衡。
• 具有模型图转换(PyTorch → ONNX → 后端引擎)的经验。
• 具备准确性管道开发和自动化框架的实践经验。理解视频生成模型准确性和多模态评估基准。
• 精通Python,并熟悉机器学习工具包(ONNX Runtime、TensorFlow、PyTorch)。
• 在准确性分析方面具有专业知识,包括统计方法和可视化工具。
• 能够有效设计准确性恢复实验并调试准确性失败。
• 了解量化技术和混合精度工作流程。
• 具有数据中心加速器(NVIDIA A100/H100/B200、AI100 Ultra、Gaudi、TPU)的经验。
• 了解LLM准确性评估工具(lm-eval、HELM、合成基准)者优先。
• 具备较强的问题解决和分析能力,能够隔离复杂的准确性问题。
• 熟悉分布式部署系统(Kubernetes、云推理服务)。
所需资格:
• 工程、机器学习/人工智能、信息系统、计算机科学或相关领域的学士/硕士学位。
• 4-10年软件工程或相关工作经验。
• 4-10年使用C、C++、Python等编程语言的经验。
提供的福利
除了与优秀的人共事外,我们还提供以下福利:
• 包括住房和交通津贴的薪资
• 股票(RSU)和与绩效相关的奖金
• 16周全薪产假
• 6周全薪陪产假
• 员工股票购买计划
• 子女教育津贴
• 迁移和移民支持(如有需要)
• 生命和医疗保险
• 健康和休闲会员费的报销
最低资格:
• 工程、信息系统、计算机科学或相关领域的学士学位,且具有2年以上软件工程或相关工作经验。
或
• 工程、信息系统、计算机科学或相关领域的硕士学位,且具有1年以上软件工程或相关工作经验。
或
• 工程、信息系统、计算机科学或相关领域的博士学位。
• 具有2年以上学术或工作经验,熟悉C、C++、Java、Python等编程语言。
• 提及的特定年限仅供参考,具有等效经验的候选人也将被考虑,只要候选人能够证明能够履行该职位的主要职责并具备所需的能力。
高通是一个平等机会的雇主。如果您是有残疾的个人,并且在申请/招聘过程中需要帮助,请放心,高通致力于提供无障碍的流程。您可以通过电子邮件联系disability-accomodations@qualcomm.com或拨打高通的免费电话。应要求,高通将提供合理的便利,以支持残疾人士参与招聘过程。高通还致力于使我们的工作场所对残疾人士无障碍。(请注意,此电子邮件地址用于为残疾人士提供合理的便利。我们不会在此回复有关申请或简历查询的请求)。
高通期望员工遵守所有适用的政策和程序,包括但不限于关于保护公司机密信息及其他机密和/或专有信息的安全及其他要求,前提是这些要求在适用法律下是允许的。
致所有人力资源和招聘机构:我们的职业网站仅供寻求高通职位的个人使用。人力资源和招聘机构及其代表的个人无权使用此网站或提交个人资料、申请或简历,任何此类提交都将被视为未经请求。高通不接受来自机构的未经请求的简历或申请。请勿将简历转发至我们的工作邮箱、高通员工或任何其他公司地点。高通不对任何与未经请求的简历/申请相关的费用负责。
如果您想了解有关此职位的更多信息,请联系高通人力资源。