职位描述
在 Mindrift,创新与机会相遇。我们相信利用集体智慧的力量来以伦理的方式塑造人工智能的未来。
我们所做的
Mindrift 平台将专家与主要科技创新者的人工智能项目连接起来。我们的使命是通过利用全球的真实专业知识来释放生成性人工智能的潜力。
职位概述
我们正在寻找经验丰富的数据科学家,为一个高级人工智能评估项目创建计算密集型的数据科学问题。这是一个远程的项目基础机会,适合能够设计需要计算方法来解决的挑战性问题,并反映完整数据科学生命周期的专家——从数据获取和处理到统计分析和可操作的商业洞察。
你将做什么
• 设计原创的计算数据科学问题,模拟各行业(电信、金融、政府、电子商务、医疗保健)的现实分析工作流程
• 创建需要 Python 编程解决的问题(使用 pandas、numpy、scipy、sklearn、statsmodels、matplotlib、seaborn)
• 确保问题计算密集,无法在合理的时间内(天/周)手动解决
• 开发需要非平凡推理链的数据处理、统计分析、特征工程、预测建模和洞察提取的问题
• 创建具有可重复答案的确定性问题——避免随机元素或要求固定随机种子以确保精确复现
• 基于真实商业挑战的问题:客户分析、风险评估、欺诈检测、预测、优化和运营效率
• 设计涵盖完整数据科学流程(数据摄取 → 清洗 → EDA → 建模 → 验证 → 部署考虑)的端到端问题
• 融入需要可扩展计算方法的大数据处理场景
• 使用标准数据科学库和统计方法通过 Python 验证解决方案
• 清晰记录问题陈述,提供现实的商业背景和经过验证的正确答案
问题领域(示例)
• 商业分析与预测建模
• 客户细分、流失预测和客户终身价值建模算法
• 通过精确-召回优化进行欺诈检测
• A/B 测试统计计算和实验设计
• 阶段分析和保留率计算
• 模型评估指标和性能优化
• 统计分析与数据处理
• 多重比较校正的假设检验
• 因果推断:倾向得分匹配、差异中的差异
• 复杂的 ETL 管道逻辑和多源数据集成
• 缺失数据插补和异常值检测算法
• 特征工程:编码、交互、降维
• 时间序列与预测
• 趋势分解和季节性检测
• 平稳性检验和自相关计算
• 预测准确度指标和移动平均计算
• 优化与运筹学
• 资源分配和约束满足问题
• 成本效益分析和产能规划优化
• 网络分析和供应链计算
• 数据库与数学基础
• 复杂 SQL 查询优化和窗口函数
• 商业场景的概率计算
• 线性代数运算和矩阵分解
• 信息理论指标(熵、互信息)
• 优化算法和收敛分析
要求
教育与核心经验
• 数据科学、统计学、数学、计算机科学或相关定量领域的高级学位(硕士或博士)
• 5 年以上的数据科学实际经验,具有显著的商业影响
• 完成项目和出版物的作品集,展示现实问题解决能力
技术技能
• 精通数据科学的 Python 编程(pandas、numpy、scipy、scikit-learn、statsmodels)
• 统计分析和机器学习——对算法、方法及其实际应用有深入理解
• SQL 和数据库操作用于数据处理和分析
现代 AI/ML(高度重视)
• 有生成性 AI 技术经验(大型语言模型、RAG、提示工程、向量数据库)
• 理解 MLOps 实践和模型部署工作流程
• 了解现代框架(TensorFlow、PyTorch、LangChain)
专业技能
• 能够设计反映现实商业场景和行业挑战的问题
• 强大的分析和解决问题的能力,注重细节
• 有将商业需求转化为技术解决方案的经验
• 清晰的技术写作和文档能力
• 精通英语以进行问题创建和沟通
优先资格
• 跨行业经验(金融、电信、医疗保健、技术)
• 具有出版物或案例研究的研究背景
• 教学、辅导或培训经验
• 数据科学或机器学习的专业认证
薪酬
基于任务的薪酬。
申请流程
请提交:
• 突出机器学习研究或工程背景的简历
• 领域知识测试
• Python 测试
• 面试