顺丰大模型算法工程师(销服)
任职要求
1、学历与经验: 计算机、人工智能、数学等相关专业硕士及以上学历,3 年及以上算法或大模型相关工作经验,具备大语言模型在真实业务场景中的落地实践经验者优先。 2、大模型与算法能力: 熟悉主流大语言模型(如 GPT、Qwen、LLaMA 等)的原理与使用方式,具备 Prompt Engineering、模型微调(SFT / LoRA)或推理优化经验;对意图识别、文本理解、信息抽取、多轮对话、任务规划等 NLP 方向具备扎实的理论基础与实践能力。 3、智能体与系统设计能力: 理解并具备基于大模型的智能体(Agent)设计与实现经验,熟悉多智能体协作机制、…
工作职责
1、大模型与智能体核心能力建设: 围绕销售及大件业务场景,负责大语言模型在意图识别、规划理解、多轮对话、用户画像与偏好洞察、话题与线索分析、知识问答及 chatBI 等核心能力上的应用设计、微调与持续优化,支撑线索智能体、销售助手智能体及大件智能体等关键场景落地。 2、智能体推理链路与多智能体协同设计: 参与线索子智能体、销售助手子智能体、大件智能体与一级、三级销售智能体的大模型协同架构设计,构建基于大模型的多轮推理、任务分解与业务决策链路,提升智能体在复杂销售与大件业务场景下的理解、决策与协同执行能力。 3、智能体工程化与能力复用建设: 设计并持续优化 Prompt、RAG(检索增强生成)、工具调用及 Agent 协作机制,推动大模型、推荐及相关决策能力的工程化落地,保障智能体能力的稳定性、可扩展性与跨场景复用。 4、业务决策模型与数据驱动优化: 结合销售线索质量、智能报价与折扣策略等业务需求,支持折扣方案模型的优化与场景拓展,通过数据挖掘与分析持续评估智能体与模型效果,驱动核心能力的迭代优化与业务价值提升。
1、大模型与智能体核心能力建设: 围绕销售及大件业务场景,负责大语言模型在意图识别、规划理解、多轮对话、用户画像与偏好洞察、话题与线索分析、知识问答及 chatBI 等核心能力上的应用设计、微调与持续优化,支撑线索智能体、销售助手智能体及大件智能体等关键场景落地。 2、智能体推理链路与多智能体协同设计: 参与线索子智能体、销售助手子智能体、大件智能体与一级、三级销售智能体的大模型协同架构设计,构建基于大模型的多轮推理、任务分解与业务决策链路,提升智能体在复杂销售与大件业务场景下的理解、决策与协同执行能力。 3、智能体工程化与能力复用建设: 设计并持续优化 Prompt、RAG(检索增强生成)、工具调用及 Agent 协作机制,推动大模型、推荐及相关决策能力的工程化落地,保障智能体能力的稳定性、可扩展性与跨场景复用。 4、业务决策模型与数据驱动优化: 结合销售线索质量、智能报价与折扣策略等业务需求,支持折扣方案模型的优化与场景拓展,通过数据挖掘与分析持续评估智能体与模型效果,驱动核心能力的迭代优化与业务价值提升。
1、深度参与 1688 销服大模型建设工作,主导大模型的训练与调优工作,运用先进的技术和算法,不断提升模型的性能与表现; 2、负责销售 copilot、人机协同服务、电销数字人、运营服务数字孪生等 AI 原生应用的设计与研发,确保产品的创新性与实用性; 3、推动 AI 原生应用在销服服务场景中的落地,深入分析业务需求,通过技术手段提升作业效率与用户体验; 4、持续关注行业内拟人交互技术的发展趋势,引入前沿技术并进行创新应用,保持团队在技术上的先进。
保险服销算法团队聚焦营销推荐/大模型在保险规划师业务场景的落地与探索,团队内技术氛围浓厚,拥有丰富的营销推荐/大模型落地经验,以及海量的对话、图像、音频、用户行为等数据,团队不断利用前沿的营销推荐/大模型技术,打造极致的用户服务体验。岗位核心工作包括: 1.负责营销推荐链路优化,包括用户表征学习、序列建模、多任务学习、多场景建模等,为业务带来有质量的用户增长; 2.提升规划师和用户的服务匹配效率,包括用户理解、规划师理解、最优化匹配等; 3.通过SFT、RL等技术,提升基模在领域的推理能力,产出个性化的保险服务策略,包括销售机会识别、服务思路SOP构建、销售话术生成等。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。