您将在一支致力于使用先进的数据分析方法进行高质量基础研究以帮助投资决策的投资团队中担任数据/NLP工程师。您需要在寻找信息方面具有战略性和创新性,并在获取新的数据集和得出非传统数据洞察力时与分析师密切合作。
职责
作为一名专注于网络爬虫和自然语言处理的高级数据工程师,您将负责使用网络爬虫工具从网站中提取数据(包括英文和中文)。您将开发和扩展创新的NLP/ML/DL算法,以从非结构化文本数据中规范化数据洞察力。我们将依赖您测试数据和爬取结果,以确保准确性和质量。您还将负责识别和纠正任何中断问题,并根据需要扩展爬取。此外,您还将:
• 构建和部署数据管道以实现先进的分析能力
• 推动数据仓库和分析平台的开发
• 构建能够批量处理大量结构化和非结构化数据的系统
• 协助数据采购并提供与团队目标相关的分析结果
资格要求
• 5年以上作为数据工程师的经验,处理大规模网络爬取、数据管道和平台,并对构建基于云的数据平台有深入理解。(AWS Spark, EMR, SageMaker, Comprehend)
• 3年以上的Python开发经验
• 熟悉爬取、提取和处理数据的技术和工具(Scrapy, pandas, MapReduce, SQL, BeautifulSoup等)
• 熟悉Linux/UNIX、HTTP、HTML、JavaScript和网络知识
• 3年以上从零开始构建和部署机器学习或NLP密集型AI算法的经验
• 具备NLP核心组件(NER、实体消歧)的工作知识和经验
• 至少有以下一种经验:Keras、Tensorflow、Caffe或PyTorch
• 有在一种或多种通用编程语言(Java、C/C++、Python等)中编写可维护、可测试、生产级代码的经验
• 具备版本控制、开源实践和代码审查经验
首选资格
• NLP、ML、AI、工程学或等同学历的硕士/博士学位
• 有使用深度学习NLP工具包的经验,如Hugging Face transformers、Deep Graph Library、DGL-KE、Spacy、ELMo、BERT
• 具备数据质量和验证经验
• 在金融或投资相关行业的经验
我们为合适的候选人提供丰厚的薪酬和福利。请将您的简历连同期望薪资发送至南丰发展有限公司人力资源经理,地址:香港中环干诺道中88号南丰大厦23楼,或发送至电子邮箱:hr@nanfung.com(我们是一家平等机会雇主,所有申请将严格保密,并仅用于选拔目的。)
有关与招聘相关的个人信息收集声明(“PICS”)的详细信息,请点击下面的链接 www.nanfung.com/en/common/pics/
“南丰集团”和“集团”指南丰集团控股有限公司及其子公司