关于UniversalAGI
UniversalAGI是一家前沿的AI研究实验室,致力于构建AI自动化的未来。当企业和政府机构需要获得竞争优势、引领市场变革或加速AI采用时,我们是首选的战略AI合作伙伴。我们在企业客户中取得了显著的进展,正处于一个关键点,正在将我们的技术能力提升到新的水平。
我们得到了Eric Schmidt、Elad Gil、Ion Stoica和David Patterson的支持。我们的精英团队拥有来自OpenAI、特斯拉、NVIDIA、苹果、Palantir、亚马逊、普林斯顿大学、斯坦福大学和加州大学伯克利分校的经验。
关于职位
我们正在寻找一位出色的创始LLM评估研究员,以建立我们全面的评估框架,保持在AI研究的前沿,设计并执行严格的实验以评估自主代理,并开发创新的方法来增强代理在实际部署中的性能和能力。
主要职责
LLM评估与框架开发
- 从头设计全面的LLM评估框架,用于政府和企业环境中的AI自动化
- 构建评估系统,以衡量和提高AI解决方案在生产部署中的性能
- 开发评估方法,用于在实际应用中自主运行的多代理系统
- 优化LLM输出,以适应涉及结构化数据库和非结构化文档库的特定企业用例
- 开发方法,以提高模型响应的准确性和针对特定领域应用的相关性
- 将研究成果转化为具备强大评估指标的生产就绪平台能力
研究与实验
- 实施并进行严格的评估实验,以优化代理性能和可靠性
- 通过阅读和综合顶级AI会议和期刊的研究成果,保持对前沿研究的了解
- 设计并执行数据收集策略,以构建针对特定用例的高质量评估数据集
- 开发方法,以在各种AI自动化任务中实现和保持高准确性标准
- 在必要时,原型化新技术和模型,以构建自主AI代理,重点提高准确性、效率和可靠性
协作与沟通
- 与产品工程师密切合作,将研究进展转化为实际应用和可部署的解决方案
- 与企业客户合作,了解评估要求和成功指标
- 通过内部演示、报告以及可能的外部出版物或会议,记录和传达研究成果
- 积极参与定义研究路线图,基于潜在影响和可行性优先考虑实验方向