关于Arteria AI Arteria AI由一支充满激情、迅速成长的团队组成，包括律师、数据科学家、开发人员和设计师，致力于为商业界构建具有变革性的AI解决方案。我们的使命是帮助公司改变与其最重要的文件——合同的互动方式。凭借我们在智能合同领域的屡获殊荣技术，我们正在寻找热情洋溢的个人，希望与我们一起成长和取得成功！职位描述作为Arteria AI的数据科学家，您将积极参与开发由机器学习和自然语言处理驱动的产品，作为我们面向AI驱动文档的企业SaaS平台的一部分。对于任何对产生影响并加入一个以创新和成长为驱动力的友好团队感兴趣的人来说，这是一个很好的角色。我们理想的候选人是一个好奇的数据科学家，具有较强的问题解决能力，并对现代自然语言处理、深度学习和建模技术有深入的了解。我们正在团队合作，我们正在寻找喜欢解决具有挑战性问题的优秀团队合作者。在这个角色中，您将： • 与其他数据科学家、MLOps、工程师和产品团队合作，构建解决现实问题的最佳方案。您将是从构思到产品上线的端到端生命周期的重要组成部分。 • 在现代AI应用的一些有趣方面工作，包括： • 多模态文档理解 • 大型语言模型及其应用 • 信息检索 • 推理和理解 • 问答 • 推荐系统 • 多语言、极端多标签分类 • 新颖的自监督/半监督和低样本/零样本方法 • 连续和元学习 • 基于知识图谱的检索、搜索和发现方法。 • 拥有访问和使用数据的所有方面，包括数据清洗、数据归一化和数据准备，用于训练、测试或推理， • 使用深度学习、自然语言处理、数据建模等各种数据科学组件，处理不同的数据集并解决现实问题。关于您：如果您是一个好奇而有动力的数据科学家，并具备以下条件，那么您将是一个合适的人选： • 量化项目的硕士学位，包括计算机科学、物理学、应用数学、统计学、工程学或相关领域，并具备以下实际知识。鼓励具有更高研究生经验（博士/博士后）的候选人申请。 • 扎实的编程经验和熟练使用Python • 熟练掌握机器学习及相关工具（SKLearn、XGBoost等） • 深入了解深度学习，对PyTorch拥有深入的专业知识。 • 精通现代自然语言处理，并对至少一个主要领域的自然语言处理有深入的了解。 • 有深度-NLP和Transformer的实践经验，并有使用Huggingface库进行Transformer模型训练和微调的经验。 • 在没有或很少监督的情况下，解决具有高度不确定性的复杂问题的经验。 • 熟悉相关的NLP工具和库（SpaCy或Stanza）将是一个加分项。 • 对向量数据库或NoSQL数据库（最好是Elasticsearch）的工作知识将是一个加分项。 • 具有大量数据处理经验，能够处理具有显著模糊性的数据，开发创造性的分析方法，并从业务/行业角度解释数据和结果 • 了解LLMs和相关库（如LangChain和Llama-Index）将是一个加分项。薪酬和福利 • 与相关经验相称的有竞争力的薪酬待遇 • 全面的福利计划 • 在一个包容性环境中支持进一步的成长和发展如果这个职位符合您的经验和兴趣，请申请！我们很乐意听到您的声音！

数据科学家 - 多模态语言模型

Arteria AI