顺丰大模型算法高级工程师
任职要求
必备条件 1. 统招硕士及以上学历,计算机科学、人工智能、软件工程等相关专业。 2. 具备5年以上后端或AI工程开发经验,其中至少2年专注于AI智能体、对话系统或大模型应用开发,并有成功的项目落地经验 。 3. 精通 Python 及异步编程,熟悉至少一种主流深度学习框架 。 4. 深入理解至少一个主流Agent框架,并有实际项目集成经验 。 …
工作职责
1. 负责客户智能体的核心架构设计、开发与迭代,实现任务规划、推理决策、多智能体协作等关键能力 。 2. 深度集成主流大语言模型,熟练运用提示词工程、微调等技术,优化智能体在物流客服场景下的意图理解、对话生成与任务执行效果 。 3. 主导智能体系统从技术选型、原型验证到大规模部署的全流程,解决高并发、低延迟等工程挑战,确保系统的高可用性与稳定性 。 4. 与产品经理、业务运营及算法团队紧密协作,深入理解客户服务流程与痛点,将技术能力转化为可量化、可落地的业务解决方案 。 5. 跟踪智能体领域的前沿技术(如Agent框架、RAG、多模态交互),进行技术预研和概念验证,推动技术在业务场景中的创新应用 。
1、负责大语言模型的Prompt Engineering、垂类应用、agent、rag、多模态大模型的研究与前沿技术跟进等工作; 2、负责研究和洞察大模型测试体系和数据构建方法; 3、负责构建、训练和优化单模态、多模态大模型,提高模型的效果,满足业务需求; 4、探索跟进大语言模型的前沿技术。
1、大模型与智能体核心能力建设: 围绕销售及大件业务场景,负责大语言模型在意图识别、规划理解、多轮对话、用户画像与偏好洞察、话题与线索分析、知识问答及 chatBI 等核心能力上的应用设计、微调与持续优化,支撑线索智能体、销售助手智能体及大件智能体等关键场景落地。 2、智能体推理链路与多智能体协同设计: 参与线索子智能体、销售助手子智能体、大件智能体与一级、三级销售智能体的大模型协同架构设计,构建基于大模型的多轮推理、任务分解与业务决策链路,提升智能体在复杂销售与大件业务场景下的理解、决策与协同执行能力。 3、智能体工程化与能力复用建设: 设计并持续优化 Prompt、RAG(检索增强生成)、工具调用及 Agent 协作机制,推动大模型、推荐及相关决策能力的工程化落地,保障智能体能力的稳定性、可扩展性与跨场景复用。 4、业务决策模型与数据驱动优化: 结合销售线索质量、智能报价与折扣策略等业务需求,支持折扣方案模型的优化与场景拓展,通过数据挖掘与分析持续评估智能体与模型效果,驱动核心能力的迭代优化与业务价值提升。
岗位职责: 1、负责大物流供应链场景下的决策智能体的研发。覆盖网络规划、资源规划、产品规划等核心业务,设计并训练具备复杂逻辑推理、任务规划及决策能力的AI智能体底盘; 2、基于 AutoGen 或 LangGraph 框架,设计和实现多智能体(Agent)系统,支持 Agent-to-Agent 协作,探索大模型在决策优化领域的应用。优化 Agent 的推理链路和交互效率,提升系统的稳定性与可扩展性。 3、与产品、业务、工程等团队紧密协作,将AI智能体与现有运筹算法、业务规则相结合,构建具备思考-规划-行动能力的智能体系统,解决实际业务中的高难度决策问题,确保模型落地后的业务价值; 4、跟踪AI及决策智能领域的前沿技术动态(如思维链CoT、RAG、智能体框架等),结合物流供应链的业务痛点,探索LLM+OR(运筹学)等创新技术方案,推动技术边界的拓展。
基座大模型研发与创新 参与设计并研发面向大规模多元时间序列的预训练基座模型,探索适用于时序数据的 Transformer变体(如Informer,FEDformer, PatchTST)及创新架构。 负责构建超大规模,高质量的时序预训练数据集,设计掩码重建,上下文预测等自监督预训练任务。 研究时间序列中的关键问题,如长周期依赖建模,多尺度特征提取,缺失值处理,以及时序与文本/事件等多模态信息的对齐与融合。 模型深度优化与领域适配 针对特定高价值场景(如电力负荷预测,量化金融,工业设备预测性维护),对基座模型进行深度微调与优化,实现"通用能力"到"领域专家"的转化。 研发高效的模型适配技术(如参数高效微调 PEFT),确保基座模型能够快速,低成本地适配到多样化的下游任务。 系统工程与高性能推理 负责将模型从研究原型推进到稳定,高性能的生产级系统。优化训练框架,利用混合并行(数据并行,模型并行,流水线并行)技术实现千亿参数模型的分布式训练。 主导模型的高效推理优化,应用量化(INT8/ FP4),编译优化等技术,大幅降低服务延迟与资源消耗,支撑海量时序数据的实时预测需求。 技术前瞻与行业赋能 追踪时间序列分析,大模型预训练的前沿学术进展,并将有潜力的技术引入到产品研发中。 与业务团队紧密合作,深入理解行业痛点,将基座模型的强大能力转化为可衡量的业务价值,定义时间序列预测领域的新标准。 岗位要求 必备条件 计算机科学,人工智能,统计学或相关专业硕士及以上学历(博士优先).