美团大模型后训练架构工程师/专家
任职要求
1.有扎实的计算机理论基础;熟练掌握常用数据结构和算法;熟练掌握C++或Python 等语言 2.熟悉transformer类模型结构,熟悉GQA、MLA、MoE等模块,熟悉常用的深度学习框架和工具; 3.具备较强的逻辑思维能力,善于分析、归纳、描述、沟通和解…
工作职责
1.负责文本、多模态等大模型后训练(微调/强化学习)能力建设,包括:训练框架研发、开源模型适配、训练成本优化、训练效果调优等。 2.协同产运、算法团队,推动后训练技术落地业务。 3.与团队其他成员密切合作,共同解决技术难题,推动团队整体技术提升。
1. 参与大语言模型(LLM)后训练全流程优化,包括但不限于通用能力提升、安全对齐等方向。 2. 实现并应用SFT/RLHF/DPO/PPO/GRPO等算法,探索多目标奖励模型、过程监督等前沿技术,提升模型在指令遵循、逻辑推理、多任务泛化等方面的性能。 3. 构建模型效果评估体系,设计自动化评估方案,持续跟踪模型优化效果。 4. 参与技术开源与学术研究,发表顶会论文或贡献核心开源项目。

1、深入理解电商平台业务场景,负责自然语言处理(NLP)、语义分析、人机对话模型等核心算法的研究与实现; 2、基于电商业务场景数据,重点负责大模型后训练算法,以及策略优化等相关工作; 3、负责搭建和优化Agentic系统,挑战将前沿Agent架构和算法应用于大规模电商核心业务,打开业务增长空间。 4、跟踪行业前沿技术,探索Agentic RL、DeepSearch、高效大模型等技术,参与新一代基座模型的调优与创新。
1. 参与蚂蚁星河金融AI应用设计和开发,支持大模型研发训练以及在业务场景的应用落地 2. 负责信贷/资管/金市投研/营销等场景大模型应用场景的落地建设,以及相关AI平台系统的架构设计与开发; 3. 负责大模型性能分析和进行调优,识别和解决瓶颈问题,包括不限模型微调训练和模型评测等,提升模型效果和推理速度;
1、负责基于扩散模型的世界生成、视频生成等相关场景的算法研发工作,结合实际应用场景攻克技术难题,包括世界生成过程中的可控性、时空一致性、实时性等问题; 2、参与并主导生成式大模型核心算法研发,包括 Diffusion、Autoregressive(AR)、VAE、Transformer 等架构。研发时空视频编码、压缩与生成算法,优化模型在生成任务中的一致性与时序表现。设计并实现从预训练到后训练(SFT、RLHF)的全流程模型优化方案,提升生成质量、可控性和效率; 3、负责生成式大模型的总体技术架构设计,探索多模态融合、跨任务迁移等创新方向,跟踪前沿研究进展,进行技术评估与落地转化,推动团队在行业/学术上的技术领先。