蚂蚁金服蚂蚁集团-大模型算法专家-北京/杭州
任职要求
1. 硕士及以上学历,计算机科学、人工智能、软件工程、数学等相关专业。 2. 具备扎实的机器学习算法基础,熟悉语言大模型的基本理论和算法。 3. 具备扎实的工程能力,熟练掌握Python编程,能高效进行代码开发和调试。 4. 具有良好的学习和沟通能力,有好奇心和责任心,具有钻研精神。 5. 具有大模型评测等相关经验,熟悉常见的大模型评测Benchmark和评测方法优先。 6. 在NeurIPS、ICML、ICLR、KDD、SIGIR等国际顶会发表过论文优先。
工作职责
负责蚂蚁集团语言大模型的评测算法研究与应用,搭建业界领先的大模型评测体系,精准全面地评估大模型的能力。基于AIGC等技术建设高质量评测数据集,与业界公开评测集有机结合,深入大模型预训练、后训练、深度思考等各个阶段,利用大模型等技术提高评测效率和准确性,通过高效高质量评测提升语言大模型、垂域大模型的能力和用户体验。
1. 负责大模型(含多模态)及下游任务的训练及优化突破,包括但不限于:异构GPU混合训练和推理加速算法;对齐、强化学习、混合专家等大模型核心训练技术。 2. 分析和解决大模型在领域应用中的技术难题并进行突破,并与业界先进技术进行持续对比。 3. 持续关注业界最新研究动向和技术趋势,对技术方向研判选型,并进行落地。 4. 与产品和工程团队紧密合作,将先进的算法技术应用于实际产品开发。
淘天集团未来生活实验室,聚焦于AI的发展,打造支撑电商及AI Native的大模型基座能力,兼顾对1-3年内和未来生活场景相关的前沿技术的研究和关注。既要支持好各个前台场景的AI化,又肩负起探索未来技术趋势的责任。 1. 探索多模态大模型,包括多模态大模型预训练、SFT微调、及RLHF对齐等技术; 2. 探索图像和视频的统一表征方法,以及长视频的高效表征压缩技术; 3. 探索将多模态大模型用于图像理解、视频理解、视觉推理、视觉多轮交互、实时对话等任务; 4. 探索原生多模态大模型的架构与训练范式; 5. 结合淘天业务场景,推动多模态大模型在淘天搜索、推荐、广告等业务中的应用。
1、 参与语音大模型的研发,包括语音识别、语音合成、音色克隆、端到端合成等技术; 2、探索歌曲、音乐等音频的理解与合成技术; 3、打造全模态的大模型; 4、将以上技术落地到淘天业务,考虑模型性能与效率。
淘天集团未来生活实验室,聚焦于AI的发展,打造支撑电商及AI Native的大模型基座能力,兼顾对1-3年内和未来生活场景相关的前沿技术的研究和关注。既要支持好各个前台场景的AI化,又肩负起探索未来技术趋势的责任。 1. 探索多模态大模型,包括多模态大模型预训练、SFT微调、及RLHF对齐等技术; 2. 探索图像和视频的统一表征方法,以及长视频的高效表征压缩技术; 3. 探索将多模态大模型用于图像理解、视频理解、视觉推理、视觉多轮交互、实时对话等任务; 4. 探索原生多模态大模型的架构与训练范式; 5. 结合淘天业务场景,推动多模态大模型在淘天搜索、推荐、广告等业务中的应用。