蔚来蔚来AGI超星计划-面向车身运动控制(VMC)的物理AI与多场景重建强化学习研究
任职要求
- 专业能力: - 具备强化学习、控制理论、车辆动力学或机器人学基础,熟悉PPO/SAC/Model-based RL等方法; - 数学基础扎实:系统动力学、最优控制、概率统计、优化方法; - 熟悉至少一种建模/仿真工具:Simulink、Simscape、CarSim、Isaac Sim、Mujoco等; - 具备Python或C++开发能力,熟悉PyTorch或TensorFlow; - 理解驾驶场景分析、风险建模、测试验证或数据闭环优化; - 加分项: - 有VMC、底盘控制、线控底盘或运动控制…
工作职责
课题介绍 本课题面向车身运动控制(VMC)在复杂工况下的性能与安全问题,构建“参数辨识 + 物理仿真 + 强化学习 + 场景风险评估”的一体化控制框架。目标是在路面附着变化、载荷波动、非线性耦合和多执行器协同等条件下,实现更稳定、更可迁移的控制策略。相较传统“模型+规则+人工调参”方法,本课题重点研究可学习的补偿控制:在保留经典控制器主结构的基础上,引入前馈补偿与残差策略(residual policy),实现误差驱动的在线修正与实时优化。同时,课题建设场景驱动风险管控链路:围绕典型、极限、长尾和高风险场景,打通仿真、HIL 与实车验证流程,形成“场景生成—策略训练—风险评估—闭环验证”的完整体系,系统评估安全性、鲁棒性与泛化能力。 具体工作 1. 搭建多层级车身动力学仿真环境(简化模型到高保真模型)。 2. 研究关键参数在线/离线辨识方法(轮胎、质量分布、阻尼、附着系数等)。 3. 设计带物理与安全约束的强化学习策略,用于前馈补偿或残差控制。 4. 研究误差学习模块与经典 VMC 控制器的协同机制。 5. 构建 VMC 场景库与风险评估体系,支持风险分级和测试覆盖分析。 6. 研究 Sim2Real 一致性与鲁棒性,建立基于实测反馈的持续优化机制。 预期产出 1. 研究报告或高水平论文(强化学习、智能控制、车辆动力学、安全验证等方向)。 2. 一套面向 VMC 的学习控制框架:参数辨识、约束强化学习、风险评估、仿真闭环。 3. 高价值场景库:覆盖典型、极限、长尾和高风险工况。 4. 可在仿真与 HIL 验证、并具备实车迁移潜力的策略原型。 5. 可复用的“仿真-HIL-实车”场景与泛化评测框架。 6. 虚实闭环工具链:数据生成、场景挖掘、参数辨识、风险评估、策略优化。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 工作职责: 1、参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)等类型模型的推理服务框架; 2、参与/负责KV Router、PD分离/EPD分离、KVCache管理、动态PD调整等分布式推理能力建设; 3、通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架; 4、参与/负责构建推理框架的系统容错能力,包括但不限于请求迁移、优雅退出、故障检测、自愈等能力建设; 5、深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、工作流编排等; 6、与全公司各业务算法部门深度合作,为重点项目进行算法与系统的联合优化,支撑业务目标达成。
大模型具备很强的泛化及理解世界能力,在小红书内的众多生产场景遍地开花,大模型的训练和部署已成为许多算法工程师的日常。在多团队、多业务频繁使用的大规模GPU集群上,如何能够通过高效的GPU调度策略,使大家不仅能丝滑地完成训练及部署任务,同时也能充分激发大规模GPU集群的效能,是行业公认的关键挑战。在这里,你可以聚焦LLM场景,接触到超大规模GPU集群,并使用真实负载数据进行深入分析及技术探索。欢迎加入我们,一起探索领先技术改变世界! 工作职责: 1、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、集群调度、GPU虚拟化、故障快速恢复、存储&网络加速等手段,提升大规模GPU集群的整体使用效率。 2、负责构建面向大模型训练、微调、推理、部署全流程LLMOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地。 3、持续关注业界最新的GPU资源调度相关技术动态,探索建设业界领先的资源调度策略及方法,构建下一代大规模AI资源调度系统。
中台稠密引擎组,是小红书负责建设通用深度学习训练推理引擎的团队,面向全公司LLM、多模态LLM、SD、传统CV&NLP等稠密计算型模型训练与推理的业务场景,打造高效、易用、业界领先的训练与推理引擎,为小红书社区、商业化、安全等众多业务方向提供先进的引擎能力,支撑业务持续提升训练推理效率、模型迭代效率与算法研发效率。 1、参与设计和实现深度学习后训练及微调的前沿算法(包括但不限于RFT、RLHF等),以适应多样化的业务场景; 2、结合业务数据和场景,评估选择最适合的微调算法,以支撑业务大语言模型(LLM)微调指标的提升; 3、与数据团队紧密合作,深入理解数据特性,参与设计实现数据提质算法引擎工具,产出高质量数据集提升模型微调效果; 4、与公司内各算法团队深度合作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 5、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性;
滴滴国际化Fintech业务,是滴滴国际化战略的重要组成板块。近年来,滴滴Fintech在拉美地区积极探索和开展电子支付、信贷、信用卡、商户收单等业务,为当地用户带来更便捷、优质、更高性价比的金融服务。我们诚挚邀请真诚、可靠、勇于挑战的您和我们一起,携手并肩,拥抱金融出海的浪潮,和滴滴Fintech一起快速成长。 1. 负责金融业务会员领域的系统设计和研发工作,包括但不限于核心业务、运营支撑等领域,为研发质量和系统稳定性负责。 2. 有机会主导并深度参与多个0-1、或1-100的关键项目建设,参与系统规划、讨论,共同打造业界领先的支付、金融平台。 3. 有机会学习并理解金融行业知识,了解海外的支付和金融市场,成为有国际化视野的技术专家。 4. base地:上海/杭州/北京