logo of sf

顺丰大模型算法工程师-博士后方向

社招全职1年以下地点:深圳状态:招聘

任职要求


24-26届博士,计算机/AI相关等相关专业博士,熟悉多模态大模型、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


业务介绍 :
聚焦物流供应链,基于文本/图像/视频多模态数据,构建垂域多模态大模型,创新PT-SFT-RLHF方法论,赋能安全检测、违规巡检,降本增效。

核心职责:
负责垂域多模态模型继续预训练,视频理解等能力的攻坚。
包括英文材料
大模型+
还有更多 •••
相关职位

logo of meituan
校招核心本地商业-业

研究方向一:大模型智能体Agent技术研究​ ​1.研究多轮长对话中的上下文管理技术,提高模型的连贯性和一致性,并探索基于用户特征和历史交互的定制对话策略,设计针对特定业务场景的微调和适应技术,提升模型在实际应用中的表现。​ 2.探索智能体调用和使用多个外部工具的方法,通过端到端后训练的方式增强其解决实际问题的能力。深度研究智能体的自我评估和学习机制,实现智能体的持续优化和能力提升。​ 3.优化LLM长链路的多轮工具调用能力,提升工具调用时的精确性及用户的实际交互体验。​ 4.设计并完善针对特定任务场景的Auto-Eval能力,指导模型迭代方向。 研究方向二:深度搜索(Deep Search/Research)技术研究​ 1.研究面向深度搜索场景的工具学习方法,基于SFT/RLHF后训练算法赋予搜索智能体高效的工具调用能力。​ 2.对齐行业最前沿的研究进展,深入研究不同工具调用环境下的大模型后训练能力边界,并基于实际业务场景进行迭代优化。​ ​研究方向三:多模态基础模型能力建设​ 1.研究多模态数据(文本、语音、图像等)的语义融合与表示方法,提升模型对复杂内容的理解能力。 2.探索多模态模型在推理任务中的表现,研究如何通过工具调用增强模型的推理能力。​ 3.设计高效的多模态模型架构,优化模型的参数规模、训练效率和推理性能,提升基础模型的通用性与适应性。 ​研究方向四:大模型分布式后训练及推理加速技术​ 1.后训练方向:样本IO吞吐优化:使用多线程读取、数据管道流水线编排、数据压缩等技术,实现分布式环境下高性能的样本IO pipeline;​计算图编译与高效执行:通过图编译、Kernel优化、算子融合等手段,提升计算图的执行效率;高性能并行训练:包括DP/TP/PP/SP/CP/EP等并行策略及其他训练超参数的自动寻优,故障自动恢复,弹性计算等;强化学习训练效率优化:通过rollout速度优化、多模型多阶段流水线编排、负载均衡等手段优化RL训练效率。 2.推理加速方向:负责实现和优化大模型在线推理系统,提升推理性能,包括不限于:架构设计、算子开发、通信优化等; 研究并实现各种模型推理加速手段如并行策略、混合精度、MOE、FP8等技术,加速模型推理速度; 设计和开发高效的离线、在线推理系统,优化SGLang、vLLM等推理框架,加速整体推理性能。

更新于 2025-05-23北京
logo of tencent
社招微信基础AI探索

1.负责社交大模型方向的记忆检索、Agent函数调用、风格化基座模型等方向的算法突破; 2.紧密贴合业务,通过后训练(SFT&RL)提升模型的专项问题解决能力; 3.基于微信场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化。

更新于 2026-02-10北京
logo of bytedance
社招A84868

1、主导SFT(监督微调)、DPO(直接偏好优化)、RL(强化学习)等大模型后训练算法的研究与开发,优化模型训练流程,提升模型在各类任务中的性能与表现,增强模型的泛化能力和适应性; 2、负责Coding、翻译、多模态等垂直领域大模型的全流程研发工作,包括需求分析、模型架构设计、数据处理、模型训练与评估,打造贴合行业场景需求的专属大模型解决方案; 3、持续跟踪行业最新技术动态,结合公司业务需求,对现有大模型算法和垂直领域模型进行优化与迭代,解决模型训练和应用过程中的技术难题,提升模型的效率和质量; 4、与数据、产品、工程等团队紧密配合,参与从数据准备、算法选型到模型部署的全链路工作,确保大模型技术在实际业务场景中的高效落地与应用; 5、将研究成果转化为实际生产力,推动大模型技术在公司产品中的应用,定期进行技术分享与交流,提升团队整体技术水平。

更新于 2025-06-03北京
logo of meituan
校招核心本地商业-业

以大模型对话技术为核心,探索前沿技术问题,研究方向主要为垂域模型的研究与构建。目标是为用户提供专属的玩乐变美便捷生活小助手,实现“技术驱动业务范式”的升级转变,最终助力商业价值全面提升。 研究方向一:Agent能力增强 基于Agent的用户助理,研究提升Agent自主规划能力,并通过Agent构建和基于后训练的优化,实现数字助理的能力复刻和增强。 研究方向二:强化学习算法研究 参与大语言模型后训练阶段的强化学习算法研究,包括基于AI和环境反馈的强化学习(RLXF)算法。同时探索奖励模型与反馈机制,研究可泛化的细粒度过程监督和奖励建模,探索基于细粒度反馈的强化学习算法。 研究方向三:垂域模型定制化构建 领域认知智能突破,探索小样本场景自演进架构设计、可信推理机制构建等方向,同时建立面向AGI的模型评价体系新范式。 研究方向四:精准上下文理解与长程依赖建模 研究如何高效、准确地捕获和利用复杂的项目级上下文信息(如整个代码库、依赖关系、API文档、Issue跟踪等),探索能够处理超长代码序列、理解跨文件依赖和项目架构的先进模型结构与表征方法,以支持更精准、更全局的代码智能,从而提升业务研发在存量代码中迭代的效率。

更新于 2025-05-23北京|上海