蚂蚁金服【蚂蚁星】大模型评测工程师
任职要求
1. 熟悉主流大模型技术原理(Transformer、RL等),具备NLP/CV领域研究或项目经验; 2. 熟悉PyTorch/TensorFlow等框架,有数据处理和算法实现能力; 3. 在模型评测/对抗样本攻防/模型可解释性任一领域有研究。
工作职责
蚂蚁集团核心风控团队大安全工程效率与品质保障团队,我们运用先进的技术和严格流程全面保障大安全业务如资金风控、内容安全、终端安全、反洗钱、基础安全等高品质高效率运转。目前团队聚焦大模型安全评测与对抗攻防核心技术,构建多维度评测体系,研发对抗框架与评测基准支持安全领域大模型发展。团队凭借亿级用户场景的实战积淀,正在大模型安全领域开拓创新。 1.设计并实施大模型多维度评测方案,覆盖功能、安全、性能等方向; 2.构建基准测试集和多维度的量化评估指标,针对安全领域设计领域专项测评方案,评估模型的领域适应性和实用性; 3.通过对抗性测试深入分析模型能力瓶颈,并提供可解释的测评报告,推动模型迭代优化。
团队主要负责蚂蚁集团大语言模型的语料优化,涵盖数据扩源、数据质量提升、合成语料、数据利用方式优化、数学/代码/推理/对话能力提升等多个方向。我们致力于通过数据驱动的方式打造业界一流的语言基座模型。 1. 负责大语言模型各阶段训练语料的优化工作,包括预训练、后训练、强化学习训练阶段,具体的工作包括体系化地扩展各类型的数据、定义并迭代优化数据质量、建设高效的合成语料技术、优化高质量数据筛选策略、优化数据配比及训练策略等; 2. 负责端到端地优化基座模型的各项关键能力,包括数学、代码、推理、对话等能力,具体工作包括扩展各能力相关的语料、定义并迭代优化数据质量、针对性地合成相关语料、优化高质量数据筛选策略、优化各阶段数据配比及训练策略、优化评测方式等; 3. 负责研发语料优化相关的基础设施,包括研发高效的数据处理算子及链路、构建数据标签体系及标注模型、探索数据与模型效果的关系、设计数据效果评估机制等; 4. 跟踪和研究大模型领域的前沿技术方向,包括但不限于语料优化、预训练和后训练算法、知识增强、数据合成等,推动技术创新并应用到基座模型训练中。
团队主要负责蚂蚁集团大语言模型的语料优化,涵盖数据扩源、数据质量提升、合成语料、数据利用方式优化、数学/代码/推理/对话能力提升等多个方向。我们致力于通过数据驱动的方式打造业界一流的语言基座模型。 1. 负责大语言模型各阶段训练语料的优化工作,包括预训练、后训练、强化学习训练阶段,具体的工作包括体系化地扩展各类型的数据、定义并迭代优化数据质量、建设高效的合成语料技术、优化高质量数据筛选策略、优化数据配比及训练策略等; 2. 负责端到端地优化基座模型的各项关键能力,包括数学、代码、推理、对话等能力,具体工作包括扩展各能力相关的语料、定义并迭代优化数据质量、针对性地合成相关语料、优化高质量数据筛选策略、优化各阶段数据配比及训练策略、优化评测方式等; 3. 负责研发语料优化相关的基础设施,包括研发高效的数据处理算子及链路、构建数据标签体系及标注模型、探索数据与模型效果的关系、设计数据效果评估机制等; 4. 跟踪和研究大模型领域的前沿技术方向,包括但不限于语料优化、预训练和后训练算法、知识增强、数据合成等,推动技术创新并应用到基座模型训练中。
团队主要负责蚂蚁集团大语言模型的语料优化,涵盖数据扩源、数据质量提升、合成语料、数据利用方式优化、数学/代码/推理/对话能力提升等多个方向。我们致力于通过数据驱动的方式打造业界一流的语言基座模型。 1. 负责大语言模型各阶段训练语料的优化工作,包括预训练、后训练、强化学习训练阶段,具体的工作包括体系化地扩展各类型的数据、定义并迭代优化数据质量、建设高效的合成语料技术、优化高质量数据筛选策略、优化数据配比及训练策略等; 2. 负责端到端地优化基座模型的各项关键能力,包括数学、代码、推理、对话等能力,具体工作包括扩展各能力相关的语料、定义并迭代优化数据质量、针对性地合成相关语料、优化高质量数据筛选策略、优化各阶段数据配比及训练策略、优化评测方式等; 3. 负责研发语料优化相关的基础设施,包括研发高效的数据处理算子及链路、构建数据标签体系及标注模型、探索数据与模型效果的关系、设计数据效果评估机制等; 4. 跟踪和研究大模型领域的前沿技术方向,包括但不限于语料优化、预训练和后训练算法、知识增强、数据合成等,推动技术创新并应用到基座模型训练中。
蚂蚁AI金融智能-财富保险事业群是全球范围内领先的金融科技团队,在这里有家喻户晓的国民级产品,也有十年磨剑不为人知的关键技术,在智能技术风起云涌的今天,我们召唤愿意追逐金融科技技术风暴的热血灵魂! 这里有聪明靠谱的伙伴、蓬勃生长的业务:这里有过吴文俊人工智能科技进步一等奖、有过数以百计的顶会论文;这里有引领时代的AI金融服务管家“蚂小财”和金融专家业务助手“支小助”;大模型已经成为落地业务的亮眼产品,惊涛骇浪中我们依然扎实前行。 技术理想主义的信念未曾动摇,用科技让世界更好的初心未曾改变!我们期待享受风暴铮铮的你,期待绽放青春昂扬的你,期待和你一起在技术星河里留下痕迹! 服销智能技术团队致力于应用业界最先进的大模型技术,让高质量金融服务人人可得;构建“AI+人工”新服销模式,推动财富和保险行业智能化转型,让创新带来新增长。团队推出的AI金融管家“蚂小财”是蚂蚁集团旗下AI First的核心战略,为用户提供包括行情解读、持仓分析、基金产品诊断、保险方案规划、智能理赔等专业服务,已经连接了200多家基金公司、券商、保险公司、财经媒体等专业机构,以及超1.5万位专业财经创作者;AI金融助手“支小助”被集成入蚂蚁10+场景,已规模化验证,提升了150%的专家销售效率、400%的专业研究效率。团队同学来自清华、北大、复旦、浙大、哈佛、牛津、剑桥、加州大学伯克利分校、新加坡国立大学等海内外知名院校,团队累计申请专利数百个,顶会论文数十篇,有着浓厚的技术创新和探索氛围,期待和更多同学一起打破天花板,创造新未来。 职位描述: 1.负责以大模型为代表的AI技术能力的建设和优化,打造业界领先的AI技术系统,主要职责包括AI系统结构设计、RAG 系统开发、大模型训练数据构建、大模型能力评测、大模型推理效果和效率优化等; 2.紧密跟踪、探索大模型方向前沿技术,依托丰富且体系化的业务生态,实践大模型算法的创新应用与落地。