关于我们
Newfold Digital是一家领先的网络技术公司,服务于全球数百万客户。我们的客户通过我们强大的品牌组合了解我们。
我们拥有业内一些最知名和历史悠久的市场品牌,包括Bluehost、HostGator、Network Solutions等。我们帮助各种规模的客户建立能够带来成果的数字化存在。
凭借我们广泛的产品供应和个性化支持,我们自豪地与客户合作,以满足他们的在线存在需求。我们公司的实力体现在我们的员工、客户和品牌的交汇点。
您的工作内容及影响
与业务合作,将需求转化为明确的问题陈述、关键绩效指标和实验计划(A/B测试、保留测试、回测)。
在数据湖/仓库堆栈上设计数据和机器学习架构(例如,Oracle Exadata、Spark/Databricks;Snowflake/BigQuery/Redshift,使用Iceberg/Delta/Hudi或同等的开放表格式)。
使用Python + SQL与编排工具(Airflow/Prefect/Dagster)构建数据摄取、特征工程和训练(批处理和流处理)管道。
使用scikit-learn/XGBoost/LightGBM和PyTorch/TensorFlow进行建模;管理实验和谱系。
在主要云ML平台(Azure ML、SageMaker或Vertex AI)上服务和操作模型,使用CI/CD、金丝雀/蓝绿部署和回滚保护。
监控和改进:
实施数据/模型质量和漂移监控、警报和仪表板;与BI(Power BI/Tableau/Looker)闭环。
文档和审查:
撰写简明的设计文档并进行技术审查;指导工程师;倡导负责任的AI实践。
您的背景及影响
8年以上应用机器学习和数据工程经验(3年以上生产ML系统交付领导经验)。
Python专家,具备生产级SQL;精通pandas/Polars、scikit-learn,以及XGBoost/LightGBM之一。
熟练掌握核心ML工具包,包括TensorFlow、PyTorch、scikit-learn,并熟悉Hugging Face或同等框架。
在构建和维护可扩展的数据管道(批处理和流处理)以进行模型训练和部署方面有成功记录。
数据平台:
熟练掌握Oracle ExaData、Spark/Databricks或Snowflake、BigQuery/Redshift或同等平台;熟悉开放表格式(Iceberg/Delta/Hudi)。
编排:
使用Airflow、Prefect或Dagster之一的真实项目经验。
云ML平台:
在SageMaker、Vertex AI或Azure ML之一上进行生产部署(管道、端点、注册表)。
MLOps:
ML的CI/CD,实验跟踪,模型注册表,可观测性(延迟、错误)和数据/模型漂移监控。
沟通:
能够权衡利弊并影响跨职能合作伙伴;撰写简洁的设计/决策文档。
本职位描述包括执行上述职位所需的基本工作职能,以及其他职责和责任。
本职位描述并非员工可能需要执行的所有职能的详尽清单。
公司保留随时修改职位描述的权利,并要求员工执行上述以外的职能。