Dice是技术专家在其职业生涯各个阶段的首选职业目的地。我们的客户Aptino正在寻找以下职位。今天通过Dice申请!
职位名称
AI工程师/开发人员
角色概述
我们正在寻找一名AI数据工程师/开发人员,负责设计、构建和维护可扩展的数据管道和AI就绪的数据系统,以支持机器学习和生成式AI应用程序。此角色位于数据工程、软件开发和AI的交汇处,确保高质量、可靠的数据从源头流向模型部署。
您将与数据科学家、ML工程师和产品团队密切合作,将原始数据转化为结构化、模型就绪的数据集和生产级AI服务。
主要职责
数据工程与管道
- 设计、构建和维护可扩展的数据管道,处理结构化和非结构化数据
- 从多个来源(数据库、API、流媒体平台、文件、传感器)获取数据
- 确保AI/ML工作负载的数据质量、验证、血统和版本控制
- 优化数据存储和检索以提高性能和成本效率
AI与机器学习支持
- 准备、转换和特征工程数据集以用于ML和AI模型
- 支持ML和基于LLM的系统的训练、评估和部署
- 构建和维护用于模型再训练和监控的数据管道
- 集成向量数据库和嵌入管道以支持AI搜索和RAG系统
开发与系统
- 使用Python和/或其他相关语言开发可重用的数据和AI服务
- 构建API和微服务以提供数据和AI输出
- 协作开发数据和ML工作流的CI/CD管道
- 监控、调试和改进生产数据和AI系统
协作与治理
- 与数据科学家、ML工程师和产品团队密切合作
- 实施数据治理、安全和合规的最佳实践
- 清晰地记录架构、管道和流程
必需资格
- 计算机科学、工程、数据科学或相关领域的学士学位(或同等经验)
- 拥有Python和数据工程框架的丰富经验
- 具有构建ETL/ELT管道和处理大型数据集的经验
- 对数据库(SQL和NoSQL)和数据建模有扎实的理解
- 熟悉机器学习工作流和AI概念
- 具有云平台(AWS、Azure或Google Cloud Platform)的经验
优先/加分技能
- 拥有ML框架(PyTorch、TensorFlow、scikit-learn)的经验
- 了解LLM生态系统(OpenAI、Hugging Face、LangChain等)
- 具有向量数据库(Pinecone、FAISS、Weaviate、Milvus)的经验
- 熟悉流媒体技术(Kafka、Spark Streaming、Flink)
- 具有MLOps工具和实践的经验
- 理解数据隐私、安全和合规标准