logo of tencent

腾讯AGI模型架构研究员

社招全职TEG技术地点:北京状态:招聘

任职要求


1.精通 Transformer 类模型及其在语言、多模态领域的架构设计与优化;
2.有构建或优化超大规模模型(>Billion-scale)经验,熟悉SFT、RLHF、自监督等训练范式;
3.在以下方向有深入理解或实践经验者优先:;
4.a.多模态模型(如视觉语言模型、音视频模型);
5.b.强化学习、自主智能体系统;
6.c.复杂推理与规划(如 search+LLM,世界建模);
7.d.稀疏建模与动态路由机制;
8.e.具备良好的工程实现能力与系统性思维,能推动前沿研究在大模型系统中落地;
9.f.在顶会/顶刊(NeurIPS, ICLR, CVPR, ACL 等)发表过相关方向…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.设计具备多模态联合感知、推理、记忆与生成能力的统一大模型架构(视觉/音频/文本);
2.构建支持持续学习、多级记忆、主动探索和自演进的大模型系统;
3.推进Agent化方向,使模型具备自主任务规划、跨模态交互、工具使用和自我优化能力,深度参与通用表征、音视频同频建模、世界模型、稀疏建模等关键模块的设计。
包括英文材料
Transformer+
系统设计+
SFT+
强化学习+
还有更多 •••
相关职位

logo of tencent
社招3年以上公共技术

1.设计具备多模态联合感知、推理、记忆与生成能力的统一大模型架构(视觉/音频/文本); 2.构建支持持续学习、多级记忆、主动探索和自演进的大模型系统; 3.推进 agent化方向,使模型具备自主任务规划、跨模态交互、工具使用和自我优化能力; 4.深度参与通用表征、音视频同频建模、世界模型、稀疏建模等关键模块的设计与实现; 5.跟踪并研究前沿技术趋势,推动创新技术在项目中的应用。

更新于 2025-12-19深圳
logo of meituan
校招核心本地商业-业

研究方向一:垂域LLM研究与构建​ 1.基座模型架构设计与优化:参与大语言模型基座架构的设计,研究前沿技术,如稀疏激活、混合精度训练等,同时优化模型的训练和推理流程。​ 2.技术创新与突破:参与前沿技术研究,如多任务学习、跨模态理解等,推动模型在复杂任务上的性能提升;探索Transformer替代架构,突破现有模型scaling law限制;同时挑战学术benchmark,为模型的性能树立新的行业标杆。​ 3.强化学习算法研究:参与大语言模型后训练阶段的强化学习算法研究,包括基于AI和环境反馈的强化学习(RLXF)算法。同时探索奖励模型与反馈机制,研究可泛化的细粒度过程监督和奖励建模,探索基于细粒度反馈的强化学习算法。​ 4.垂域模型定制化构建:领域认知智能突破,探索小样本场景自演进架构设计、可信推理机制构建等方向,同时建立面向AGI的模型评价体系新范式。​ 5.跨部门协作与落地:与公司数据科学家、算法工程师、产品团队紧密合作,将研究成果快速转化为实际应用,推动大语言模型在更多场景的落地。​​ 研究方向二:垂域MLLM研究与构建​ ​1.研究多模态表征与大语言模型融合的前沿技术,设计和实现创新算法,研究异质数据的统一编解码模型,适配多种模态下的特征统一,实现高效微调与优化。​ 2.探索强化学习(RL)在多模态大模型中的应用,包括强化学习增强的多模态生成、跨模态对齐、偏好建模及自适应优化,提升多模态理解与推理能力。 ​3.持续追踪多模态与强化学习结合的最新研究进展,优化现有多模态系统架构,提升性能、效率与可扩展性,推动多模态强化学习在智能体交互、决策推理等任务中的应用。 ​4.构建技术评估体系,通过多场景验证推动多模态理解、生成及强化学习优化策略的落地应用,提升多模态大模型的泛化能力和实际应用价值。​​ 研究方向三:基于角色扮演的虚拟数字助理 ​​1. 角色扮演技术(Role-Playing):通过模型优化、Agent构建,在人设、拟人性、情感等取得显著提升。 ​2. 记忆管理与增强(Memory):通过模型长上下文,记忆抽取与管理,提升系统的记忆能力。 ​3. 个性化技术:通过用户行为数据挖掘与建模,结合多轮对话上下文理解,分析用户情感状态,提升模型的个性化回复能力。 ​4. 基于Agent的数字助理:通过Agent构建和基于RL的优化,实现数字助理的能力复刻和增强

更新于 2025-05-23北京
logo of jd
社招算法开发岗

1.研究实现AGI的关键能力,通过技术愿景驱动研究工作。负责大语言模型和多模态大模型的训练和优化(包括预规划、后训练等)长期课题的研究,提升大语言模型的能力,并在广泛业务场景中产生价值。 2.负责LLM训练相关的工作,包括后预训练、Instruction Tuning以及强化学习等; 3.深入参与数据及评估体系建设、大规模训练、指令微调、偏好对齐、模型优化等关键工作; 4.探索大模型底层技术突破,深入大模型基础架构前沿研究(如MoE、注意力机制、x等),探索新型架构和技术创新。

更新于 2025-07-22北京
logo of jd
社招算法开发岗

1.研究实现AGI的关键能力,通过技术愿景驱动研究工作。负责大语言模型和多模态大模型的训练和优化(包括预规划、后训练等)长期课题的研究,提升大语言模型的能力,并在广泛业务场景中产生价值。 2.负责LLM训练相关的工作,包括后预训练、Instruction Tuning以及强化学习等; 3.深入参与数据及评估体系建设、大规模训练、指令微调、偏好对齐、模型优化等关键工作; 4.探索大模型底层技术突破,深入大模型基础架构前沿研究(如MoE、注意力机制、x等),探索新型架构和技术创新。

更新于 2025-08-07北京