logo of meituan

美团基座大模型算法专家

社招全职核心本地商业-基础研发平台地点:北京 | 上海状态:招聘

任职要求


1. 对大模型开发流程有深入认知,熟悉预训练、指令微调、RLHF等流程与框架,具备模型预训练、对齐、训练和推理加速、模型小型化和部署等方面的经验;

2. 熟悉Transformer等模型架构,对GPT系列、LLAMA系列和MoE等模型架构有深入理解并拥有大规模训练经验;

3. 具备扎实的算法和数学理论基础及良好的编程基础,熟悉自然语言处理、生成式AI和机器学习等技术,熟悉PythonJava等至少一种编程语言,熟悉PyTorchTensorflow深度学习框架,对技术开发及应用有热情;

4. 目标感强,善于分析和发现问题,拆解简化,有想法并乐于挑战自我,能够从日常工作中发现新的空间;

5. 条理性强且有推动力,能够梳理繁杂的工作并建立有效机制,推动上下游配合完成目标。

具备以下条件优先
1. 在ACL、EMNLP、NeurIPSICLRICML等计算机学会推荐的国际会议和期刊发表过论文者优先;

2. 在国际或国内权威赛事或评测中取得优秀名次者优先;

3. 有大模型训练和调优经验,熟悉分布式和混合精度训练基本方法与框架。

工作职责


1. 基座大模型预训练,包括但不限于不同规模、不同结构的语言模型和多模态模型的数据准备和优化、模型预训练、训练加速与框架优化等;

2. 大模型对齐技术(SFT、RLHF等)链路整体优化,包括数据探索与增强、对齐流程探索、奖励模型优化、强化学习策略迭代等,持续提升对齐效果;

3. 大模型训练和推理优化,包括但不限于高效训练技术和框架设计与实现、模型小型化技术(稀疏化、压缩、剪枝、蒸馏等)探索与落地、高效推理技术实现等;

4. 大模型相关技术前沿探索,包括但不限于Scaling Law、模型架构探索(MoE、MAMBA等)、训练范式探索、长序列技术探索、高效训推框架探索等;

5. 支撑内部应用需求,对接搜索、推荐、广告等实际业务场景,实现大模型应用落地。
包括英文材料
大模型+
Transformer+
GPT+
算法+
NLP+
机器学习+
Python+
Java+
PyTorch+
TensorFlow+
深度学习+
NeurIPS+
ICML+
相关职位

logo of vivo
社招10年以上研发类

一、 1. 负责端侧基座大模型相关算法研究、重难点技术攻关,下游应用场景包括面向手机场景的文本、多模态内容生成和理解任务(智能手机助手、UI-Agent等)。 2. 跟进业界最新的文本、多模态预训练、强化学习、推理增强模型相关技术和方法,根据公司内重点业务场景的需求,研发行业领先的原创性算法,提供行业领先的端侧基座模型。 3. 顶会论文发表,对外技术分享,提高团队整体技术影响力。 二、

更新于 2025-06-27
logo of mi
社招A210746

负责VLA(视觉-语言-行动)多模态大模型在自动驾驶和机器人场景中的前沿算法研究,涵盖场景理解、语义引导决策、时空建模等核心能力; 主导VLA模型预研,构建可泛化、高可解释性的多模态基座大模型,为未来6~12个月技术演进提供基础支撑; 与高校及实习生协作,探索VLA的长期发展方向,包括表征学习,具身智能、慢系统蒸馏快系统等核心议题; 撰写高水平论文、技术文档,推动VLA方向在CVPR、NeurIPS、ICLR、CoRL等会议中的学术影响力。

更新于 2025-03-26
logo of antgroup
社招1年以上技术类-算法

1)训练安全基座大模型,在开源大模型基础上持续预训练实现知识注入、后训练实现指令对齐, 涵盖dense\moe架构、多模态、长上下文推理(QwenLong-L1)等各类基座。 2)探索研究安全基座大模型在各风险领域的应用,并与策略、技术等各岗位同学密切合作、推动落地。 3)快速搭建各类Agent,熟悉deepsearch/工具调用,有较强动手能力。

更新于 2025-06-09
logo of 10jqka
校招AI 算法类

1.负责公司大模型基座、多模态大模型核心算法研发(包括不限于文本,视频,图片,音频等); 2.负责大模型基座、多模态模型大规模训练加速,压缩、蒸馏、微调等技术方案。