logo of antgroup

蚂蚁金服蚂蚁技术研究院长期研究型实习生-大模型算法

实习兼职蚂蚁技术研究院长期研究型实习生项目地点:北京 | 上海 | 杭州状态:招聘

任职要求


1. 学历背景:计算机科学、人工智能、数据科学、数学等相关专业的硕士或博士在读学生。
2. 技术能力:
* 精通Python编程,具备扎实的算法数据结构机器学习基础。
* 精通深度学习大模型框架(如PyTorch、Huggingface transformer、LangChain、vLLM、DeepSpeed、Megatron-LM等)。
* 了解大模型的基本原理、训练和评估流程。
3. 研究经验:
* 有大模型合成数据相关研究经验者优先。
* 有处理和分…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


职位描述:
参与大模型的前沿研究工作。你将与顶尖的研究团队合作,探索数据在大模型训练、优化和应用中的核心作用,推动大模型数据智能领域的创新。

研究内容:
1.研究和实践创新的数据生成策略,为模型打造高质量、高信息量的人类偏好数据集
2.迭代和优化 Critic Model,设计有引导性的评估规则,使其能够对模型输出进行自动化、高质量的打分
3.搭建和维护贯穿训练全过程的持续评估系统,实时监控模型的价值对齐、输出风格及其他关键性能指标,确保模型行为符合预期
包括英文材料
学历+
数据科学+
Python+
算法+
数据结构+
机器学习+
深度学习+
大模型+
PyTorch+
Transformer+
还有更多 •••
相关职位

logo of antgroup
实习蚂蚁技术研究院长

通过大模型的架构、预训练、继续预训练和模型融合方法等创新,推进大模型在通用智能领域的进展

北京|杭州|上海
logo of antgroup
实习蚂蚁技术研究院长

1. 结合知识图谱和LLM,构建一个AI系统解决现实世界里的复杂问题(如生成机器学习算法,数据分析,生成代码等等); 2. 近期的研究方向包括并不限于: (1) 用于复杂问题求解的知识增强型大语言模型 (2)图基础模型 (3)基于代码图的代码生成 (4)用符号推理增强LLM的推理 3. 开展与其它相关领域/学科结合的交叉研究,拓宽知识图谱和LLM的应用范围; 4. 将相应成果以论文形式发表到顶尖学术会议/期刊,并与研发团队协作落地到实际场景

北京|上海
logo of antgroup
实习蚂蚁技术研究院长

项目简介: 蚂蚁技术研究院计算系统实验室先进加速技术团队旨在为同态加密计算、大模型推理等新兴应用探索加速技术栈,涵盖应用优化、算法并行优化、体系结构优化、电路优化、系统优化等多个方向。

北京|上海|杭州
logo of antgroup
实习蚂蚁技术研究院长

1. 设计与开发评测方案: 围绕大语言模型和多模态大模型的各项能力,设计科学、公正、全面的评测(Benchmark)方案和对应的数据集。 2. 搭建评测平台: 参与或负责自动化评测系统的开发、部署和维护,提升模型迭代和评测效率。 3. 执行与分析: 对主流的开源及闭源大模型进行系统性评测,并对自研模型进行深度分析,撰写评测报告,为模型的优化方向提供数据支持。 4. 追踪前沿动态: 持续关注业界最新的大模型评测方法、基准和技术,并将其应用到实际工作中。

杭州