logo of baidu

百度大模型平台策略算法工程师(J97419)

社招全职ACG地点:北京 | 上海状态:招聘

任职要求


-教育背景: 计算机、人工智能等相关专业本科及以上学历
-编程功底: 熟练掌握 PythonPyTorch,具备扎实的数据结构与算法基础,具备良好的工程实现能力
-大模型经验: 熟悉 Transformer 架构及大模型训练原理、熟悉后训练常用技术(SFT、 DPO、 RFT)、熟悉分布式并行策略(…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


-负责Post-training工具链开发: 负责千帆MAAS平台大模型SFT、蒸馏、强化学习(RL)等后训练环节的工具链开发,提升大规模训练的稳定性与执行效率
-负责RLaaS能力落地: 参与“强化学习即服务(RLaaS)”的方案调研与实现,通过解耦算力资源与算法逻辑,让内外部客户能够高效低成本在自身业务数据上启动高效率的 RL 训练
-提升平台易用性与扩展性: 快速定位并解决用户线上问题,将高频业务需求沉淀为平台通用功能,通过组件化设计优化工具链的复用性
-前沿技术落地: 跟踪调研业内主流后训练技术,负责将其转化为平台核心能力,保持产品的技术领先性
包括英文材料
学历+
Python+
PyTorch+
数据结构+
还有更多 •••
相关职位

logo of kuaishou
社招D7965

1、负责AIGC算法在特效业务应用落地,结合公司内部快意/可图/可灵/TTS等大模型平台,按照业务需求在特效魔表/模板/虚拟人等领域进行AIGC应用落地; 2、负责短视频生产/直播/商业化/用增/电商等场景特效智能策略算法研发优化。提高用户对智能化魔表/模板/美化等特效使用基础体验,增强特效业务智能化; 3、负责特效大数据加工和分析,通过多模态内容理解、转化行为因果推断、QoS和QoE运筹优化等对特效全面理解,挖掘生产、消费信号,洞察业务痛点,指导及优化特效相关业务内容。

更新于 2025-06-20北京
logo of didi
社招8年以上技术

1、负责网约车交易市场一站式智能策略平台的整体架构设计、搭建与落地;推动数据、特征工程、样本管理、机器学习、策略引擎、实验评估等能力的全域打通,构建一体化策略研发底座,标准化、工程化的策略研发与迭代体系,适配交易市场多业务场景的策略研发需求; 2、保障策略平台的稳定性和迭代效率,通过技术架构优化、流程标准化、工具能力升级,系统性提升算法策略的研发效率、上线速度与迭代质量,支撑业务策略快速落地与效果迭代,保障策略全生命周期的高效管理与稳定运行; 3、联动算法、工程、业务等相关团队,精准对齐策略平台建设需求,推动策略平台的应用落地与持续优化,输出策略平台使用指南与技术支持,提升团队平台使用效率; 4、持续优化策略迭代流程,通过工具化、自动化、智能化能力建设,降低算法研发与策略落地的工程成本,解决平台运行中的核心技术瓶颈; 5、跟踪行业前沿技术与策略平台建设趋势(如大模型与策略平台融合、自动化机器学习等),引入适配业务的技术方案,推动策略平台技术能力持续领先;

更新于 2026-02-02
logo of baidu
社招ACG

-负责千帆MaaS平台级推理降本与效率优化策略设计与落地,并支持定制化推理性能优化 -负责量化、投机推理(MTP / speculative decoding / Eagle)等训练–推理协同优化方案的设计与落地 -负责建设大模型推理性能评测与收益评估体系 -前沿技术落地:调研并落地大模型推理多维度优化技术,包括但不限于模型量化(INT4/INT8/FP8,含PTQ/QAT两种方式)、MTP投机推理优化、结构化剪枝与稀疏化等,持续提升推理效率与资源利用率,降低部署成本。

更新于 2026-02-10北京
logo of tencent
社招3年以上公共技术

1.负责大模型全模态从训练到推理部署的全流程工作,在机器学习平台上引入并优化前沿算法和技术,以推动工程与模型性能的提升和业务的落地。专注于以下一个或多个方向:; 2.训练数据构建与优化:开发自动化工具和智能算法,以优化多源数据的获取、清洗、配比和合成,提升训练数据的质量和效率; 3.模型训练与优化:设计和实现训练流程自动化工具,包括超参数优化、训练早停策略、模型选择等,以提高训练效率和模型性能; 4.强化学习与后训练优化:研究和应用强化学习算法,包括异步方法、长思考推理模型训练等,以提升模型的样本效率和稳定性; 5.Agentic RL应用:利用Tool-integrated Reasoning等技术解决复杂业务问题,搭建适用于不同场景的Agentic RL框架。

更新于 2025-08-18深圳