美团【北斗实习】前沿自动驾驶算法开发与落地
任职要求
1.计算机科学、人工智能领域,具有扎实的深度学习、计算机视觉/自然语言处理基础; 2.具有优秀的编程能力,熟悉PyTorch、Tensorflow等深度学习框架,能熟练进行模型研发和测试; 3.具备一定的科研能力,能够承担科研探索工作和先进技术落地推进工作。 具…
工作职责
工作城市可选北京、深圳 1.端到端自动驾驶建模:参与、设计及实现端到端的自动驾驶建模方法,搭建从传感器数据到行为决策的端到端模型。 2.多模态大模型在自动驾驶场景中的适配和优化:如:大模型指令微调和策略迭代、开放场景下的目标识别技术等,以适应不同的自驾场景,并提高模型的鲁棒性和泛化能力。 3.生成式仿真系统构建,研发基于扩散模型的场景生成技术和仿真技术。开发仿真-真实数据闭环系统。
基于数据驱动模型端到端一体化的长期需求,我们寻找有极强的技术信仰与热情,富有好奇心和驱动力的候选人。参与探索自动驾驶面向未来的算法设计和工程优化的综合性问题。 1.探究自动驾驶领域分布式训练的效率极限,通过底层硬件和分布式集群/存储优化,结合深度学习框架特性和极致算子性能优化,达到MFU上限。 2.基于VLM、LLM等大模型技术和无人配送的业务特点,探索自动驾驶新一代的模型结构范式,推动自动驾驶技术的进一步发展。
简介:大语言模型后训练前沿算法研究包括但不限于: 1、对齐算法研发:包括 SFT 数据建设,指令微调等。构建高质量的训练数据,包括自动化数据清洗、合成数据生产、高质量 Prompt Engineering 等。优化模型复杂指令遵循、逻辑推理、创作写作、代码生成以及工具调用等能力,提升模型综合能力和用户体验。 2、人类偏好对齐:包括奖励模型、人类偏好对齐等前沿强化算法的探索和实践,提升模型在包括创意写作、对话风格以及模型内生安全对齐等人类偏好上的可控性,生成更符合人类价值观、逻辑习惯和审美偏好的内容。 3、跟踪并实现最新的后训练技术(如数据领域自动化配比、后训练机制设计和优化等)。
简介:多模态大模型能力在近年飞速发展,模态的统一、任务的统一、多种模态联合生成和实时交互带来了崭新的应用体验和生产力提升。在这个过程中,我们需要脚踏实地的同时仰望星空,发挥想象力预判新模型能力带来的应用场景革新,研究达到理想态的关键演进路径并进行度量分析,指引长期有潜力的模型迭代方向。方向包括但不限于: 1、多模Agent方向:包括在多模态的工具调用和GUI/CUA,探索结合多模原生能力的OpenClaw展现出的生产力提升潜力,从基座模型能力角度分析其中的关键影响因素并进行自动化度量,指引基座模型的迭代。 2、多模态统一方向:包括全模态统一模型、音视频联合生成等,思考在模态统一、任务统一和多种模态联合生成过程带来新的能力跃迁并进行度量,分析模态和任务间的相互关联,指引模型架构、训练策略等选型。 3、多模交互方向:包括通用世界模型、音视频交互等,研究动态多轮交互中的一致性、真实性和长程记忆等关键能力的自动化度量,指引基座模型的迭代。
随着大模型与生成式 AI 技术的快速发展,在多模态和复杂场景下让 Agent 具备更强大的决策和执行能力成为未来的重要趋势。OpenAI Operator 通过结合强化学习的多步决策机制与大模型的理解、推理优势,可在多种任务场景(如 Computer Use、网页浏览等)中实现高效且灵活的自动化决策和任务执行。本课题将聚焦多样化业务场景和复杂环境下的自适应策略设计、规划与推理,进一步提升 Agent 在真实应用中的表现。 主要研究内容包括但不限于: 1) 多模态与多步决策:设计并构建包含多模态信息、计算机交互、网络搜索、函数调用等多维度的复杂环境,研究如何利用端到端强化学习来进行多步决策,从而完成更具挑战的任务。 2) 策略学习与优化:在多种强化学习算法(如 PPO、GRPO 等)的框架下,探索高效的策略优化方法,为 Operator Agent 提供强大的决策和执行能力。 3) 规划与推理:借助大模型的知识与推理能力,设计可解释的多步规划算法;研究如何与外部工具或知识库交互,以扩展 Agent 的能力边界并提升其在真实环境中的自动化决策表现。