小米端到端算法(主动安全方向)开发专家/工程师
任职要求
1. 人工智能,强化学习,计算机视觉等相关专业; 2. 有模型的开发…
工作职责
1. 负责端到端模型开发,主要包括:模型设计,模型预训练,多任务调优,数据闭环优化等 ; 2. 负责主动安全功能的优化,验证,以及上下游的对接等工作。
将大模型能力做成可上线、可迭代、可控成本的产品能力。通过打造数据飞轮、模型适配与后训练、评测与实验等关键手段,实现端到端的闭环交付,持续提升产品的效果与稳定性。 具体职责包括以下相关方向的一项或多项:包括语言大模型(LLM)应用后训练与智能体优化、多模态大模型(VLM/MLLM)应用后训练与智能体优化,以及图像、视频、语音、文档等场景下的 AIGC 能力构建与生成效果优化。 需求与问题定义 深入业务与产品共创需求,深入业务与产品共创需求,将文本、图像、视频、语音、文档等场景诉求转化为可执行的 AI 任务定义,明确目标、边界、优先级与验收口径。 方案与应用架构 在Prompt、RAG、微调、Agent等路线间做技术选型与权衡,设计端到端应用架构(含上下文、工具调用、记忆、权限与安全),并完成RAG、Multimodal RAGMemory、Tool Use、多Agent等能力的工程化落地与生产级集成。 数据飞轮与治理 搭建高效的数据采集、清洗与标注工程流水线。前瞻性地探索合成数据与模型自标注等自循环策略,同时建立完善的数据版本追踪与质量评估体系,真正打通“模型训练-业务应用-用户反馈-数据迭代”的增强回路。 模型适配与后训练 主导基座大模型向顶尖垂直行业专家的后训练的全链路技术演进,包括高质量的SFT、RL阶段PPO、GRPO等前沿强化学习与偏好优化算法攻坚,全面突破模型在复杂业务场景下的指令遵循精度、极致可控性与长链路逻辑推理天花板,显著提升大模型在复杂业务场景下应用能力。 评测体系与实验 面向业务目标设计评测指标与Rubric,搭建自动化评测框架(含人工评审),建立离线基准与线上实验体系(A/B、Bandit),持续监控指标漂移与策略投机以防止效果退化。 生产交付与运营 负责系统集成与上线发布,对线上质量、稳定性与成本负责,建立监控、告警、兜底与人工接管机制,推动持续迭代。
1. 深入研究不同行业SaaS/AI原生软件的行业发展方向、典型场景清单、业务流程、技术架构等,梳理各场景在AI应用的需求和价值,帮助SaaS等软件企业设计AI落地路径; 2. 从头部AI原生软件/SaaS类客户典型业务场景出发,结合阿里云千问模型、百炼、Agent平台等AI核心产品,帮助软件企业设计和落地大模型解决方案(覆盖客服、金融、办公OA、ERP、CRM、零售、营销、制造、医疗等行业赛道),包括如下: 1)客户需求洞察及方案设计 • 大模型场景洞察:理解客户业务场景、整体技术架构,主动挖掘客户核心业务中的高价值的大模型应用场景,与客户共创业务和技术的关键问题与效果标准,理解行业内AI场景的价值。 • 方案设计:基于客户业务目标与技术约束,设计端到端MaaS解决方案,涵盖模型选型、工程链路(推理/微调/RAG/Agent)、效果评估体系及上线路径。 2)售前引导和支持与实操能力 • 结合客户的业务场景需求,通过标杆案例及demo演示展示阿里云大模型的竞争优势,建立在客户侧的技术影响力,影响客户的决策。向客户高层展示阿里云AI全栈产品的竞争优势,确保技术方案与客户业务目标深度绑定。 • 技术验证:动手搭建Prompt、RAG、多Agent工作流及微调实验,快速验证业务可行性,对POC结果的安全性、稳定性、性能、可持续性和运行效率给出技术建议。对客户业务与技术双线相关人员清晰阐述AI带来的效率提升、成本节约或收入增长,建立科学的AI效果评估共识。 3)能力沉淀和赋能 • 构建可复用的知识资产:沉淀面向细分领域/场景的大模型调用最佳实践、细分领域标杆案例等知识文档。 • 内部团队、生态伙伴、客户赋能和培训。 4)产品需求和改进反馈 • 识别和理解阿里云大模型的技术问题和机会,传递客户需求和反馈给产品团队,影响功能开发和未来产品路线图,保持阿里云产品的市场竞争力。 • 了解客户大模型使用的情况恶化效果,将客户使用中遇到的影响客户体验的问题,反向推动内部解决,推动内部产品解决方案和流程体系的改进。

1. 深入研究不同行业SaaS/AI原生软件的行业发展方向、典型场景清单、业务流程、技术架构等,梳理各场景在AI应用的需求和价值,帮助SaaS等软件企业设计AI落地路径; 2. 从头部AI原生软件/SaaS类客户典型业务场景出发,结合阿里云千问模型、百炼、Agent平台等AI核心产品,帮助软件企业设计和落地大模型解决方案(覆盖客服、金融、办公OA、ERP、CRM、零售、营销、制造、医疗等行业赛道),包括如下: 1)客户需求洞察及方案设计 • 大模型场景洞察:理解客户业务场景、整体技术架构,主动挖掘客户核心业务中的高价值的大模型应用场景,与客户共创业务和技术的关键问题与效果标准,理解行业内AI场景的价值。 • 方案设计:基于客户业务目标与技术约束,设计端到端MaaS解决方案,涵盖模型选型、工程链路(推理/微调/RAG/Agent)、效果评估体系及上线路径。 2)售前引导和支持与实操能力 • 结合客户的业务场景需求,通过标杆案例及demo演示展示阿里云大模型的竞争优势,建立在客户侧的技术影响力,影响客户的决策。向客户高层展示阿里云AI全栈产品的竞争优势,确保技术方案与客户业务目标深度绑定。 • 技术验证:动手搭建Prompt、RAG、多Agent工作流及微调实验,快速验证业务可行性,对POC结果的安全性、稳定性、性能、可持续性和运行效率给出技术建议。对客户业务与技术双线相关人员清晰阐述AI带来的效率提升、成本节约或收入增长,建立科学的AI效果评估共识。 3)能力沉淀和赋能 • 构建可复用的知识资产:沉淀面向细分领域/场景的大模型调用最佳实践、细分领域标杆案例等知识文档。 • 内部团队、生态伙伴、客户赋能和培训。 4)产品需求和改进反馈 • 识别和理解阿里云大模型的技术问题和机会,传递客户需求和反馈给产品团队,影响功能开发和未来产品路线图,保持阿里云产品的市场竞争力。 • 了解客户大模型使用的情况恶化效果,将客户使用中遇到的影响客户体验的问题,反向推动内部解决,推动内部产品解决方案和流程体系的改进。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。