BPX GenAI Squad 数据科学家需求
数据科学家 AIML P2P3
经验 6-8 年
所需技能
对机器学习、深度学习概念、技术、算法有专家级理解
具备构建端到端机器学习和深度学习解决方案的实际工作经验
精通 Python 编程是先决条件
对面向对象编程和设计原则有深入理解
熟悉 Python 中常用的数据科学包,如 Pandas、Numpy、Matplotlib,以及框架如 Tensorflow、Pytorch
具备使用 FlaskAPI、FastAPI 开发 RESTful API 的实际经验
对 NLP 概念和库有出色理解,包括 Word2Vec、TFIDF、NLTK、SpaCy、Gensim、BERT、GloVe 等
必须有 NLP/NLG/NLU 项目开发经验
深入理解 Transformer 架构,包括 BERT、GPT、DistillBert
良好理解生成式 AI 概念,如大语言模型、微调、评估 LLMs、PEFT、RAG、嵌入、向量数据库等
有使用 LangChain、LlamaIndex 等框架的经验
有使用大语言模型如 Llama、GPT、PaLM 等的经验
有使用 Amazon Bedrock、Azure OpenAI、GCP GenAI Studio 的经验
优先考虑具备训练和微调 LLMs 专业知识者
熟练掌握模型开发、部署和优化技术
优先考虑持有 GenAI/AIML 认证者
有在云环境中部署 AI 解决方案的经验
具备任一主要云服务 AWS/Azure 的工作知识
具备 AWS SageMaker/Azure Cognitive Services/Google Vertex AI 的工作知识
持有任一云平台 AWS/Azure/GCP 的认证
良好的问题解决和批判性思维能力
熟悉版本控制系统 Git
了解 SQL 和 NoSQL
关键角色与职责
创建和维护高质量、可重用的代码组件和库以供将来使用
进行严格的测试和验证,确保模型在各种条件下准确高效地运行
确保应用程序在各种平台和设备上的最佳性能、响应能力和可扩展性
优化应用程序以实现最大速度、可维护性和可靠性
根据需要与跨职能团队和各方利益相关者合作
指导团队成员并进行代码审查,确保卓越的编码标准
保持对生成式 AI 领域最新发展的更新
积极承担任务并根据需要承担额外责任
应乐于在快节奏的团队文化中工作