小米端到端数据闭环研发工程师
任职要求
1. 本科及以上学历,计算机及相关专业; 2. 计算机基础扎实,熟悉数据结构与算法; 3. 熟悉至少一门编程语言,熟悉常用的服务端开发…
工作职责
1. 负责自动驾驶大规模数据挖掘及数据合成平台的设计与研发,高效支撑算法数据需求; 2. 负责自动驾驶大规模数据管线的设计与研发,保障数据加工产线高效率、低成本运转; 3. 负责自动驾驶数据集管理平台的设计与研发,高效支撑模型训练迭代。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。
1. 面向有道词典、词典笔、学习规划/小P老师等产品线,负责 Agent 能力的整体方案与核心算法研发,包括任务分解、计划-执行/反思循环(Plan-Execute / ReAct / Reflection)、长短期记忆与工具路由等; 2. 负责 SLM(Small Language Model)持续预训练与指令微调(SFT),构建高效压缩与蒸馏方案,面向端侧/低延迟场景优化推理效率; 3. 设计与实现工具调用(Function/Tool Calling)体系:工具编目与路由、参数填充、结果验证与回退、调用链追踪与可观测性,提升工具使用的成功率与收益; 4. 基于强化学习(PPO/GRPO/DPO 类方法等)与奖励建模,面向语义理解、工具使用成功率、内容生成质量等目标进行对齐与优化,支持离线/在线策略迭代; 5. 负责搜索与排序相关模型:语义检索embedding/rerank、学习排序(pointwise/pairwise/listwise)、点击/转化信号建模与评估; 6. 负责数据全链路:高质量数据构建、策略采样、合成与清洗、去重与去噪、难例挖掘、失败案例回放及工具轨迹数据集构建; 7. 建立系统化评测体系:离线基准(理解/工具成功率/可用性)、端到端任务评测、A/B 实验与线上指标监控,推进效果持续迭代; 8. 推动工程化落地:训练管线与分布式并行、推理服务化与弹性扩缩、缓存与检索加速、成本/时延/稳定性优化; 9. 跨团队协作,与产品、工程、数据及标注团队紧密配合,按期高质量交付,持续提升用户体验与业务指标。
负责AliExpress 跨境电商业务的交易,营销,支付,结算,逆向,价格领域等核心基础链路场景的服务端工作。来AE基础链路团队,从全链路视角和闭环感受AE的核心业务和技术。在这里,你能参与到AE订单管理等交易链路的设计,你能参与到AE优惠活动、购物券等营销链路设计,你能参与到AE国际化、多币种、多渠道支付链路设计,你能参与到AE金额结算链路设计,你能参与到AE逆向交易链路的设计。共同打造阿里巴巴核心的跨境电商交易系统;只要你敢想,我们就敢一起干。我们的目标是打造全球化的基础链路团队,保障AE全链路的稳定性,提升AE全链路的性能,来满足我们的全球化买家更快、更好的购物体验。