顺丰大模型算法高级工程师-(智能体)
任职要求
具备大规模语言模型(LLM)或多模态大模型的预训练,指令微调(SFT)或对齐(RLHF)全流程实践经验。 对Transformer架构,缩放定律,大模型训练稳定性有第一手的技术洞察和实操经验。 精通Python,熟练掌握PyTorch框架,具备出色的工程实现与调试能力。 核心技能 扎实的机器学习基础,出色的数据敏感性和分析能力。 熟悉Linux开发环境,具备大规模分布式训练或高性能推理优化经验者…
工作职责
基座大模型研发与创新 参与设计并研发面向大规模多元时间序列的预训练基座模型,探索适用于时序数据的 Transformer变体(如Informer,FEDformer, PatchTST)及创新架构。 负责构建超大规模,高质量的时序预训练数据集,设计掩码重建,上下文预测等自监督预训练任务。 研究时间序列中的关键问题,如长周期依赖建模,多尺度特征提取,缺失值处理,以及时序与文本/事件等多模态信息的对齐与融合。 模型深度优化与领域适配 针对特定高价值场景(如电力负荷预测,量化金融,工业设备预测性维护),对基座模型进行深度微调与优化,实现"通用能力"到"领域专家"的转化。 研发高效的模型适配技术(如参数高效微调 PEFT),确保基座模型能够快速,低成本地适配到多样化的下游任务。 系统工程与高性能推理 负责将模型从研究原型推进到稳定,高性能的生产级系统。优化训练框架,利用混合并行(数据并行,模型并行,流水线并行)技术实现千亿参数模型的分布式训练。 主导模型的高效推理优化,应用量化(INT8/ FP4),编译优化等技术,大幅降低服务延迟与资源消耗,支撑海量时序数据的实时预测需求。 技术前瞻与行业赋能 追踪时间序列分析,大模型预训练的前沿学术进展,并将有潜力的技术引入到产品研发中。 与业务团队紧密合作,深入理解行业痛点,将基座模型的强大能力转化为可衡量的业务价值,定义时间序列预测领域的新标准。 岗位要求 必备条件 计算机科学,人工智能,统计学或相关专业硕士及以上学历(博士优先).
岗位职责: 1. 负责制定大语言模型方向的技术战略与演进路线,持续引领团队在算法创新、系统部署、智能体架构等关键方向取得突破; 2. 全面统筹垂域大语言模型的研发、评估与部署生命周期,推动算法与系统能力的标准化、模块化和可复用建设; 3. 牵头在客服、销售、收派、运营、办公智能等核心领域构建智能体系统,重构关键业务流程,推动大语言模型的深度融合与落地应用; 4. 主导复杂业务问题的抽象建模,构建行业级、多任务、多场景的评估体系,覆盖模型精度、稳定性、安全合规等维度; 5. 制定并实施大语言模型系统性能优化策略,构建资源利用率高、弹性强的推理服务架构,提升模型部署效率与稳定性; 6. 引导团队围绕业务目标开展系统性大语言模型算法调研与分析,识别潜在问题与机会点,提出可落地的优化方案; 7. 紧跟大语言模型领域技术发展,持续输出行业趋势洞察,制定面向未来的技术路线与实施规划; 8. 管理算法团队,对团队成员进行技术引领、指导、职业发展辅导,保持团队先进性。
职位描述 1、负责人工智能大模型的研发工作, 研发基于大模型的AI搜索、用户理解、ChatBot、检索增强、导购助手等应用,确保产品的创新性与实用性 2. 深度参与AI搜索类产品建设工作,主导大语言模型(LLM/MLLM)的预训练、持续训练、SFT、RLHF 等技术,不断提升模型的性能与表现。 3. 推动 AI 应用落地搜索场景,深入分析业务需求,通过技术手段提升作业效率与用户体验; 4. 持续关注行业内人工智能技术的发展趋势,引入前沿技术并进行创新应用

负责企业大模型项目的落地交付,面向客户现场提供定制化算法解决方案。利用大模型与多智能体方法,针对具体业务需求进行算法设计、模型调优及效果验证。指导交付团队解决技术问题,确保方案高效、准确地实现。岗位工作涵盖算法应用、业务问题建模及客户方案交付。 主要工作内容: 1. 深入理解客户业务需求,提供可落地的AI解决方案 2. 基于大模型及多智能体方法,结合客户的需求,进行算法定制与优化 3. 指导低阶交付同学解决算法问题,保障交付质量 4. 参与客户现场交流和方案演示,解答技术问题
1. 具身智能大模型研究与优化 (1) 研究和构建具身智能大模型(Embodied Foundation Models)与机器人大脑。 (2) 探索语言、视觉、动作等多模态融合机制(VLM / VLA / VLA-Agent)。 (3) 优化模型的长时记忆、推理能力与可泛化性。 2. 机器人智能算法研发 (1) 设计和实现机器人多模态感知、导航、操作、交互等核心算法模块。 (2) 推进大模型驱动的机器人任务规划与决策。 (3) 基于模拟器与真实世界数据,进行大规模对齐与强化学习(Sim2Real, RLHF, Imitation Learning)。 3. 系统落地与协同研发 (1) 与硬件与系统团队协作,推动模型算法在真实机器人平台上的部署与性能调优。 (2) 支撑具身智能大模型的云端训练体系、数据闭环与MLOps工程。 (3) 发表高水平论文或申请相关专利,推动业界与学界前沿研究。