人工智能研究工程师 - 强化学习(100%远程)

伦敦 4天前全职 网络
面议
加入Tether,共同塑造数字金融的未来 在Tether,我们不仅仅是在构建产品,而是在开创一场全球金融革命。我们的尖端解决方案使企业——从交易所和钱包到支付处理器和ATM——能够无缝地在区块链上集成储备支持的代币。通过利用区块链技术的力量,Tether使您能够以极低的成本即时、安全、全球地存储、发送和接收数字代币。透明性是我们一切工作的基石,确保每笔交易的信任。 与Tether一起创新 Tether金融:我们的创新产品套件以全球最受信任的稳定币USDT为特色,数亿人依赖于此,同时提供开创性的数字资产代币化服务。 但这仅仅是开始: Tether动力:推动可持续增长,我们的能源解决方案通过在最先进的、地理多样化的设施中使用环保实践优化比特币挖矿的多余电力。 Tether数据:推动AI和点对点技术的突破,我们通过尖端解决方案(如我们的旗舰应用KEET)降低基础设施成本并增强全球通信,重新定义安全和私密的数据共享。 Tether教育:民主化顶级数字学习的获取途径,我们赋予个人在数字和零工经济中茁壮成长的能力,推动全球增长和机遇。 Tether进化:在技术和人类潜力的交汇处,我们正在突破可能性的界限,创造一个创新与人类能力以强大、前所未有的方式融合的未来。 为什么加入我们? 我们的团队是一个全球人才库,远程工作遍布世界各地。如果您热衷于在金融科技领域留下印记,这是您与一些最聪明的头脑合作、突破界限并设定新标准的机会。我们快速成长,保持精简,并在行业中确立了领导地位。 如果您具备出色的英语沟通能力,并准备为地球上最具创新的平台做出贡献,Tether就是适合您的地方。 您准备好成为未来的一部分了吗? 关于职位 作为AI模型团队的一员,您将推动强化学习方法在高级模型中的创新。您的工作将优化决策和自适应行为,以提供增强的智能、改进的性能和针对现实世界挑战的领域特定能力。您将跨越广泛的系统工作,包括为有限硬件环境设计的资源高效模型和集成文本、图像和音频等数据的复杂多模态架构。 我们希望您在设计强化学习系统方面具有深厚的专业知识,并在高级模型架构方面有扎实的背景。您将采用实践、研究驱动的方法来开发、测试和实施新颖的强化学习算法和训练框架。您的职责包括策划专业的模拟环境和训练数据集,加强基线策略性能,并识别和解决强化学习过程中的瓶颈。最终目标是解锁卓越的、领域适应的AI性能,并推动这些模型在动态现实环境中能够实现的极限。 职责 - 开发和实施最先进的强化学习算法,旨在优化模拟和现实环境中的决策过程。设定明确的性能目标,如奖励最大化和策略稳定性。 - 构建、运行和监控受控的强化学习实验。跟踪关键性能指标,同时记录迭代结果并将结果与既定基准进行比较。 - 识别和策划高质量的模拟环境和训练数据集,以应对特定领域的挑战。设定可衡量的标准,以确保这些资源的选择和准备显著增强学习过程和整体模型性能。 - 通过分析计算效率和学习性能指标,系统地调试和优化强化学习管道。解决奖励信号噪声、探索策略和策略分歧等问题,以提高收敛性和稳定性。 - 与跨职能团队合作,将强化学习代理集成到生产系统中。定义明确的成功指标,如现实世界性能改进和在各种条件下的鲁棒性,并确保持续监控和迭代改进以实现持续的领域适应。 - 计算机科学或相关领域的学位。理想情况下,拥有NLP、机器学习或相关领域的博士学位,并在AI研发方面有扎实的记录(在A*会议上有良好的出版物)。 - 具有大规模强化学习实验的丰富经验,包括在线RL技术,如群体相对策略优化(GRPO),是必不可少的。您的贡献应已导致领域特定决策和整体策略性能的可衡量改进。 - 深刻理解强化学习算法,包括最先进的在线RL方法和其他基于梯度的优化方法,如策略梯度、演员-评论家和GRPO。您的专业知识应强调在复杂、动态环境中增强策略稳定性、探索和样本效率。 - 必须具备PyTorch和相关强化学习框架的强大专业知识。期望在开发RL管道方面有实践经验,从模拟和在线训练到后训练评估和在生产环境中部署基于RL的解决方案。 - 展示了应用实证研究克服强化学习挑战的能力,如样本效率低下、探索-利用权衡和训练不稳定性。您应熟练设计稳健的评估框架,并在算法创新上进行迭代,以不断推动RL代理性能的边界。 对候选人的重要信息 招聘骗局越来越普遍。为保护自己,请在申请职位时牢记以下几点: - 仅通过我们的官方渠道申请。除非明确说明,否则我们不使用第三方平台或代理进行招聘。所有开放职位都列在我们的官方招聘页面:https://tether.recruitee.com/ - 验证招聘人员的身份。我们所有的招聘人员都有经过验证的LinkedIn个人资料。如果您不确定,可以通过查看他们的个人资料或通过我们的网站联系我们来确认他们的身份。 - 对不寻常的沟通方式保持警惕。我们不通过WhatsApp、Telegram或短信进行面试。所有沟通均通过官方公司电子邮件和平台进行。 - 仔细检查电子邮件地址。我们发出的所有通信将来自以@tether.to或@tether.io结尾的电子邮件。 - 我们绝不会要求支付或提供财务细节。如果有人在招聘过程中任何时候要求提供个人财务信息或付款,那就是骗局。请立即举报。 如有疑问,请随时通过我们的网站联系我们。