首席数据科学家,自然语言处理(NLP)
角色和责任
关于UTC网络
UTC是下一代金融互联网基础设施的建设者,它组织全球金融信息和服务资源,使这些设施、信息和服务资源能够更容易、更具成本效益地访问。
UTC的核心价值是:“做正确的事情,出乎意料地行动,保持简单,帮助他人”。
保持正直和出人意料,保持谦逊和帮助他人。
正直、非凡、简单和利他主义。
关于这个职位
作为公司的战略性首席数据科学家的重要成员之一,参与推动自然语言处理(NLP)战略和技术方向。
职责
• 与高级管理层和内外利益相关者密切合作,转换数据并定义问题
• 承担领导责任,独立管理NLP数据科学项目
• 进行自然语言处理和机器学习的研究,使用不同的模型
• 在数据团队和开发团队内发展和重新定义NLP功能的最佳实践
• 根据要求开发NLP系统
• 训练开发的模型并运行评估实验
• 对结果进行统计分析并优化模型
• 保持对机器学习这个快速变化领域的更新
• 参与数据科学项目的端到端工作,包括分析、设计、开发和部署
技能和资格
• 具有计算机科学、统计学、数据科学、系统工程或相关领域的博士学位
• 在金融或技术行业(金融科技)有经验,能够理解金融领域知识
• 熟练掌握Python、Java、R、C++等编程语言
• 熟练掌握数据库,如Mango DB、Postgres、Mysql、Dolphin DB等
• 有使用AI-NLP方法和工具的经验,例如:
a) NLP的迁移学习(GPT、BERT、ELMo、ULMFiT)、NLP框架、genism、spaCy
b) 机器学习框架(TensorFlow、PyTorch、Keras)
c) 循环神经网络(RNN)及其变种,如LSTM
d) 大型LLM模型(OpenAI GPT、BERT、LLaMA)
e) NLP流水线和任务
• 使用数据和云存储(AWS、Azure、Google、Hadoop、Kafka、noSQL)的经验
• 良好的沟通能力
• 具有分析思维和解决问题的能力
• 能够与业务各个领域的利益相关者跨部门合作