顺丰大模型算法工程师-博士后方向

社招全职1年以下2026-01-27地点：深圳状态：招聘

扫码手机上打开

任职要求

24-26届博士，计算机/AI相关等相关专业博士，熟悉多模态大模型、…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

业务介绍 ：
聚焦物流供应链，基于文本/图像/视频多模态数据，构建垂域多模态大模型，创新PT-SFT-RLHF方法论，赋能安全检测、违规巡检，降本增效。

核心职责：
负责垂域多模态模型继续预训练，视频理解等能力的攻坚。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

【北斗】大模型算法工程师（多模态/后训练/DeepSearch/RL）

校招核心本地商业-业

研究方向一：大模型智能体Agent技术研究 1.研究多轮长对话中的上下文管理技术，提高模型的连贯性和一致性，并探索基于用户特征和历史交互的定制对话策略，设计针对特定业务场景的微调和适应技术，提升模型在实际应用中的表现。 2.探索智能体调用和使用多个外部工具的方法，通过端到端后训练的方式增强其解决实际问题的能力。深度研究智能体的自我评估和学习机制，实现智能体的持续优化和能力提升。 3.优化LLM长链路的多轮工具调用能力，提升工具调用时的精确性及用户的实际交互体验。 4.设计并完善针对特定任务场景的Auto-Eval能力，指导模型迭代方向。研究方向二：深度搜索（Deep Search/Research）技术研究 1.研究面向深度搜索场景的工具学习方法，基于SFT/RLHF后训练算法赋予搜索智能体高效的工具调用能力。 2.对齐行业最前沿的研究进展，深入研究不同工具调用环境下的大模型后训练能力边界，并基于实际业务场景进行迭代优化。研究方向三：多模态基础模型能力建设 1.研究多模态数据（文本、语音、图像等）的语义融合与表示方法，提升模型对复杂内容的理解能力。 2.探索多模态模型在推理任务中的表现，研究如何通过工具调用增强模型的推理能力。 3.设计高效的多模态模型架构，优化模型的参数规模、训练效率和推理性能，提升基础模型的通用性与适应性。研究方向四：大模型分布式后训练及推理加速技术 1.后训练方向：样本IO吞吐优化：使用多线程读取、数据管道流水线编排、数据压缩等技术，实现分布式环境下高性能的样本IO pipeline；计算图编译与高效执行：通过图编译、Kernel优化、算子融合等手段，提升计算图的执行效率；高性能并行训练：包括DP/TP/PP/SP/CP/EP等并行策略及其他训练超参数的自动寻优，故障自动恢复，弹性计算等；强化学习训练效率优化：通过rollout速度优化、多模型多阶段流水线编排、负载均衡等手段优化RL训练效率。 2.推理加速方向：负责实现和优化大模型在线推理系统，提升推理性能，包括不限于：架构设计、算子开发、通信优化等；研究并实现各种模型推理加速手段如并行策略、混合精度、MOE、FP8等技术，加速模型推理速度；设计和开发高效的离线、在线推理系统，优化SGLang、vLLM等推理框架，加速整体推理性能。

更新于 2025-05-23北京

微信基础-大模型算法工程师-社交AI方向

社招微信基础AI探索

1.负责社交大模型方向的记忆检索、Agent函数调用、风格化基座模型等方向的算法突破； 2.紧密贴合业务，通过后训练（SFT&RL）提升模型的专项问题解决能力； 3.基于微信场景数据提供技术解决方案，探索业界前沿技术在业务中的落地与指标优化。

更新于 2026-02-10北京

资深算法工程师（大模型方向）-算法策略

社招A84868

1、主导SFT（监督微调）、DPO（直接偏好优化）、RL（强化学习）等大模型后训练算法的研究与开发，优化模型训练流程，提升模型在各类任务中的性能与表现，增强模型的泛化能力和适应性； 2、负责Coding、翻译、多模态等垂直领域大模型的全流程研发工作，包括需求分析、模型架构设计、数据处理、模型训练与评估，打造贴合行业场景需求的专属大模型解决方案； 3、持续跟踪行业最新技术动态，结合公司业务需求，对现有大模型算法和垂直领域模型进行优化与迭代，解决模型训练和应用过程中的技术难题，提升模型的效率和质量； 4、与数据、产品、工程等团队紧密配合，参与从数据准备、算法选型到模型部署的全链路工作，确保大模型技术在实际业务场景中的高效落地与应用； 5、将研究成果转化为实际生产力，推动大模型技术在公司产品中的应用，定期进行技术分享与交流，提升团队整体技术水平。

更新于 2025-06-03北京

【北斗】大模型算法工程师（服务零售）

校招核心本地商业-业

以大模型对话技术为核心，探索前沿技术问题，研究方向主要为垂域模型的研究与构建。目标是为用户提供专属的玩乐变美便捷生活小助手，实现“技术驱动业务范式”的升级转变，最终助力商业价值全面提升。研究方向一：Agent能力增强基于Agent的用户助理，研究提升Agent自主规划能力，并通过Agent构建和基于后训练的优化，实现数字助理的能力复刻和增强。研究方向二：强化学习算法研究参与大语言模型后训练阶段的强化学习算法研究，包括基于AI和环境反馈的强化学习（RLXF）算法。同时探索奖励模型与反馈机制，研究可泛化的细粒度过程监督和奖励建模，探索基于细粒度反馈的强化学习算法。研究方向三：垂域模型定制化构建领域认知智能突破，探索小样本场景自演进架构设计、可信推理机制构建等方向，同时建立面向AGI的模型评价体系新范式。研究方向四：精准上下文理解与长程依赖建模研究如何高效、准确地捕获和利用复杂的项目级上下文信息（如整个代码库、依赖关系、API文档、Issue跟踪等），探索能够处理超长代码序列、理解跨文件依赖和项目架构的先进模型结构与表征方法，以支持更精准、更全局的代码智能，从而提升业务研发在存量代码中迭代的效率。

更新于 2025-05-23北京|上海