阿里巴巴业务技术-AI Agent应用算法工程师-物流质控
任职要求
1. 具备扎实的大模型研发经验,主导或深度参与过大模型预训练、领域自适应微调或AI Agent系统构建,熟悉任务定义、领域数据构造、推理/工具调用设计及线上效果落地等关键环节; 2. 硕士及以上学历,机器学习、深度学习、人工智能、自然语言处理、计算机视觉等相关专业; 3. 具备…
工作职责
1. 参与淘天物流全链路智能化质控体系构建,打造通用物流质控AI Agent,持续提升订单履约质量与消费者体验; 2. 基于淘天海量数据,深入分析物流全链路异常与对抗行为(如虚假发货、轨迹伪造、黑灰产等),识别关键问题与治理机会; 3. 设计并实现物流场景下的机器学习、深度学习及多模态质控算法,针对典型异常模式开发高精度识别算法与治理方案; 4. 构建高质量、多模态物流质控数据体系,融合文本、图像、语音、行为序列及时空轨迹等多源异构数据,为模型提供可靠的数据基础; 5. 研发物流场景下的智能质控基座大模型,通过领域自适应预训练与精细化微调,提升大模型对物流异常模式与对抗行为的深度理解能力。
我们正在寻找热爱 AI 的你,共同探索智能物流领域的无限可能。如果你渴望在日均亿级包裹的淘天电商物流网络中,用 AI Agent 重构淘天电商物流业务形态,构建下一代淘天智能物流技术体系,这里是你理想的舞台!加入我们,你将: 1. 重塑物流履约体验:构建消费者体验、智能订单履约、智能物流质控、智能财务损益、商家运营提效等物流 Agent,实现从订单接入到末端配送的全链路智能决策,让每一个包裹更快、更准、更省地送达消费者手中; 2. 驱动物流数据智能化:建设智能数据商业分析 Agent,以 AI 驱动物流数据需求高效交付、商业洞察主动发现、分析能力跨场景规模化复用,让数据从"被动出报表"进化为"主动驱动业务决策",支撑物流业务商业决策; 3. 构建智能物流技术基建:打造智能物流 Agent 基础设施平台,建设统一的开发框架、评估体系、可观测性平台、工具链与安全护栏,为物流全场景 Agent 规模化落地提供坚实底座,打造 AI 时代高效交付的新研发模式; 4. 实践敏捷全栈团队:参与以业务价值交付为中心的敏捷全栈团队实践——以业务目标驱动需求拆解,以端到端闭环打通业务需求、产品设计、Agent 研发、测试评估、产品发布到智能运营的完整研发流程,以持续交付、测试左移、即时反馈的敏捷实践驱动业务价值落地; 在 AI 与物流深度融合的新时代,让我们一起用 Agent 重新定义物流!来吧,期待你的加入,开启属于你的智能物流创新之旅!
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。
【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 工作职责: 1、参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)等类型模型的推理服务框架; 2、参与/负责KV Router、PD分离/EPD分离、KVCache管理、动态PD调整等分布式推理能力建设; 3、通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架; 4、参与/负责构建推理框架的系统容错能力,包括但不限于请求迁移、优雅退出、故障检测、自愈等能力建设; 5、深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、工作流编排等; 6、与全公司各业务算法部门深度合作,为重点项目进行算法与系统的联合优化,支撑业务目标达成。