美团【基座大模型北斗实习】具身智能前沿技术研究
实习兼职核心本地商业-基础研发平台地点:北京 | 上海状态:招聘
任职要求
1、硕士及以上学历,计算机科学、人工智能、机器人、软件工程、计算机视觉、自然语言处理等相关专业,博士优先; 2、具备优秀的编程能力,熟悉PyTorch,有大规模分布式训练和物理仿真引擎(Isaac Gym, Sapien, MuJoCo)使用经验; …
登录查看完整任职要求
微信扫码,1秒登录
工作职责
简介:具身智能是通往通用人工智能(AGI)的“最后一块拼图”,也是将AI从数字世界(Digital World)引入物理世界(Physical World)的关键枢纽。真正的智能不应仅存在于对话框中,而应具备理解物理法则、感知复杂环境并执行精准操作的能力。 本课题致力于打造世界一流的具身智能团队,构建统一的感知-决策-控制底层架构。我们探索将视觉、语言与动作指令深度耦合,赋予机器人像人类一样“看懂世界、预判未来、灵活操作、自然交互”的原生能力,挑战物理世界中的复杂长程任务,推动具身智能从实验室走向千家万户。 具体地,我们关注如下研究方向: 1、具身大模型感知与决策:探索构建端到端(End-to-End)的Vision-Language-Action(VLA)大模型。研究如何将海量互联网多模态数据与机器人异构动作数据进行统一表征预训练,提升模型在开放场景下的零样本任务泛化能力,实现从高层逻辑推理到底层电机控制指令的平滑映射。 2、物理世界模型与因果推理:研究基于生成式架构的物理世界模型,使机器人能够通过视频生成或状态预测“预判”行动后果。探索如何在大模型中建模物理定律(重力、摩擦、刚性/流体等),通过想象进行自监督学习和虚拟进化,解决物理实验数据稀缺与长尾场景模拟的难题。 3、视觉语义导航与长程规划:针对大尺度、动态变化的未知环境,研究结合常识推理的视觉语言导航(VLN)技术。利用大语言模型的逻辑链(CoT)能力,将复杂的模糊指令分解为可执行的动作序列,解决具身智能在复杂物理空间中的定位、语义地图构建及长程任务中的意图保持问题。 4、敏捷运动控制与精细操作:探索强化学习(RL)与大模型结合的全身协同控制方案。包括但不限于:人形机器人的复杂地形敏捷行走、基于触觉-视觉融合的多指灵巧手精细操作。研究如何通过Sim-to-Real技术将大规模仿真学习的策略高效迁移至真实硬件,实现丝滑的物理动作输出。 5、具身人机交互与在线进化:构建自然的自然语言/手势交互界面,使机器人能理解人类的情境、反馈并进行修正。研究基于人类反馈的具身强化学习与示范学习,使智能体能够在与环境、人类互动的过程中实现技能的增量学习与自我迭代。
包括英文材料
学历+
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
Gymnasium+
https://gymnasium.farama.org/index.html
An API standard for reinforcement learning with a diverse collection of reference environments
https://www.youtube.com/watch?v=FvuyrpzvwdI
Learn to use Gymnasium for Python, which allows you to create environments to run reinforcement learning programs against in Python.
还有更多 •••