logo of didi

滴滴post-training框架研发专家(J250314019)

社招全职技术地点:北京状态:招聘

任职要求


1. 计算机科学、数学、统计学、自动化等相关专业本科及以上学历。
2. 熟悉Post-Training流程,深入了解RL领域,包括但不限于RM、PPO、DPO、GRPO等算法。
3.具备大模型训练框架开发能力,包括pytorch、me…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.参与滴滴内部 post-training 框架研发,聚焦 LLM + RL 方向,设计框架架构与技术路线,提升其扩展性、稳定性与效率。
2.优化框架性能,如训练速度、显存占用等,降低训练成本,为 LLM + RL 训练提供有力技术支撑。
3.协同业务团队,将 LLM 能力在业务场景落地,根据业务需求定制训练方案并评估验证模型。
4.关注行业前沿,引入有价值的技术到公司框架和模型中,探索新算法与方法,推动技术创新。
包括英文材料
学历+
算法+
大模型+
PyTorch+
Megatron+
还有更多 •••
相关职位

logo of baidu
社招3年以上ACG

-负责大模型应用开发平台的算法设计与优化,提升开发者在平台上的体验与应用效率 -研究并应用前沿的深度学习和机器学习算法,推动大模型在实际业务场景中的应用落地,重点关注RAG、Agent、工作流等能力方向 -深入掌握Function Call,代码解释器,Post-training等原理及常用方法 -与产品、工程团队紧密合作,理解业务需求,制定相应的算法解决方案 -持续优化算法的效率和效果,确保平台的高性能和高可用性

更新于 2025-03-27北京
logo of bytedance
社招1年以上A247041

团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、团队负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式;主要工作方向包括: 1)优化&创新RLHF算法训练效率与模型泛化能力; 2)Long CoT技术的实现和应用; 3)多模态大模型(文本、图像、语音)的Posttraining算法; 4)构建高质量、多领域的数据合成方法; 5)探索LLM在情感对话、创作等场景的应用。

更新于 2025-02-18上海
logo of xiaohongshu
社招大模型

在算力驱动的 AGI 和人文精神的烟火气交汇之处,我们真诚邀请对大模型 Omni Model 有热情的同学加入,共同打造更具影响力的智能系统。你会成为团队的一员,并和其他同事协作,共同研发 SOTA 的 Omni Model。期待你以务实和客观的科学态度来推进技术的进展,不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态。 区别于传统 ASR / TTS 级联技术,我们希望打造端到端的 Omni Model 在实时交互中释放大模型的智力水平,彻底改变以 Chatbot 文字为主的人机交互界面 岗位说明:你会负责围绕大模型 Omni Model 构建语音模态的相关研究工作,包括但不限于如下事项 海量的语音数据处理和构建:定性分析、定量评估数据质量,并给出 scalable 的改进方案;探索跨模态(文字/视觉/语音)混合训练的最佳实践; 探索更加高效且合理的模型架构,让模型更加理解音频,同时让模型具备更好的语音合成能力 研究并探索基于 Omni Model 的 Post Train,包含但不限于 SFT 和 RL

北京|上海
logo of ke
社招XYZ

1、参与通用大模型和领域大模型的post-train算法研发工作,包括SFT、RLHF、DPO、推理强化学习等; 2、参与大模型在AI搜索中的落地应用,包括function call、DSL、planning、图表理解、RAG等能力建设; 3、进行大模型在幻觉消除、multi-agent、self-play、表示学习、持续学习等前沿方向的研究。

更新于 2024-12-25北京