职位描述:
概述
作为一名专注于AI/ML、后端开发和分布式系统的高级SOC工程师,您将推动创新以增强我们的安全运营中心能力。此角色涉及设计、部署和管理AI驱动的自动化工作流程,将ML/GenAI解决方案投入生产,并构建可扩展的后端服务以优化事件响应和运营效率。您将利用云原生技术(Azure)、DevOps实践和MLOps工具来实施安全、合规的部署,包括向量搜索和RAG管道。与跨职能团队的合作以及指导初级工程师是此职位的重要组成部分。
职责
职责:
- 自动化和AI技术管理:开发、实施和维护AI驱动的全栈解决方案,以提升用户体验并优化内部工作流程。
- 后端服务和API开发:使用Python、Typescript、Node.js等语言开发和运营可扩展的后端服务和AI/ML工作负载的API。
- AI/ML平台演进:构建和增强平台组件,如特征和嵌入存储、向量搜索/语义搜索基础设施、评估仪表板、提示/版本管理和反馈循环。
- 安全与负责任的AI:实施安全、数据保护和负责任的AI防护措施,确保模型和数据的安全合规使用。
- 云原生和DevOps实践:应用最佳实践,使用Azure和本地容器化、CI/CD管道(Azure Devops / Gitlab)。基础设施即代码用于可扩展的部署。
- 跨职能协作:与产品、数据科学、数据工程、设计和DevOps/SRE团队密切合作,将业务问题转化为稳健的技术解决方案。
- 集成和编排:将自动化和AI技术与现有SOC工具和技术集成,在不同的安全系统中编排工作流程,以实现无缝响应协调。
- 性能监控和优化:监控自动化和AI技术的性能,识别并解决任何问题或瓶颈,以确保最佳功能和可靠性。
- 文档和培训:维护AI工作流程、配置和程序的全面文档。为内部用户和工程师提供培训和指导。
资格
技能:
- 在生产环境中部署AI/ML和生成式AI解决方案的实际经验,包括微调和集成基于转换器的模型,以及设计和实施RAG管道和高级语义搜索系统。
- 精通Python、Typescript编程经验和自动化脚本编写。
- 拥有MLOps经验,包括ML工作流程的CI/CD、模型部署以及性能和数据漂移的监控。
- 精通一种或多种AI/ML框架和工具,如Hugging Face Transformers、Agno AI、LangChain、MLflow、vLLM、Ollama或等效平台,用于模型部署和编排。
- 具有构建和管理具有强大可观察性的分布式、可扩展服务的经验(指标、日志、跟踪、仪表板、警报)。
- 拥有MLOps经验,包括ML工作流程的CI/CD、模型部署以及性能和数据漂移的监控。
认证
- 任何AI和ML技术的认证。
- 任何平台和自动化的认证是加分项。
教育经验
- 计算机科学、信息技术、网络安全或相关领域的学士或硕士学位。
- 至少7年的软件工程师经验,具有机器学习、后端开发和分布式系统的丰富经验。
- 具有网络安全领域技术角色的经验者优先。
要求: