logo of momenta

Momenta世界模型算法实习生

实习兼职研发地点:北京 | 上海状态:招聘

任职要求


1.计算机科学、人工智能、自动化或相关领域的985/211硕士以上学历,博士最优。
2.精通PythonC++或其它编程语言,具有良好的数据结构和算法基础。
3.熟悉huggingface/github上的各种智驾领域的sota云…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 熟悉bev/occ/静态bev/3d等方向的云端模型训练和相关推理部署、Drivesora/Qwen-WAN等世界模型-生成大模型的多模态训练和相关推理部署、基于3DGS的StreetGaussian/DGGT/ReconDreamer场景重建算法开发和相关推理部署。
2. 熟悉自动驾驶数据的预处理、挖掘和特征工程, 对大模型的强化学习及相关框架有一定了解更佳。
3. 结合公司已有的自动驾驶相关数据对大模型finetune,使世界模型更好服务于自动驾驶业务的数据和仿真需求。
4. 与部署优化工程师合作,确保算法的实际可行性和集成性。
5. 跟踪最新的科研进展和技术趋势,将前沿技术应用于解决实际问题中。
包括英文材料
学历+
Python+
C+++
数据结构+
还有更多 •••
相关职位

logo of didi
社招技术

公司介绍 滴滴于 2016 年组建自动驾驶技术研发部门,致力于打造世界领先的 L4 级自动驾驶技术,通过科技让出行更安全、更高效。我们相信,将自动驾驶技术部署在共享出行车队中,将创造最大的社会价值。依托滴滴在出行领域的 先进技术、海量数据、丰富经验和完整的出行平台生态,我们正在打造并运营世界领先的自动驾驶 Robotaxi 车队,推动自动驾驶在城市复杂交通场景中的规模化落地。 职位描述 作为感知团队的一员,你将与国内外顶尖人才一起,研究和开发自动驾驶领域的前沿算法,直接赋能 L4 Robotaxi 的大规模部署。 你将面向真实城市道路场景中的多样化挑战,利用多模态传感器(LiDAR、Camera、Radar 等)设计、开发并优化感知算法,解决物体识别、障碍物检测、场景理解、意图预测与大模型赋能等核心问题。 在这里,你将有机会: 与中美两地的优秀工程师和科学家合作,参与世界级的技术竞争; 深入研究并推动最前沿的学术成果在产业中的落地; 在全球最大出行平台之一的业务场景中,实现科研成果的规模化应用。 主要方向与职责: 你将在以下方向中选定一个或多个方向深入负责,并承担从研发到落地、从算法到系统的端到端职责: (一)物体识别与跟踪 设计并实现基于 LiDAR / Camera / Radar 的多模态检测模型,识别车辆、行人、自行车、静态障碍物、交通标志等 提升精度、召回率与抗扰性(抗遮挡、夜间、恶劣天气、长尾类别) (二)通用障碍物识别 识别未知类别 /未训练类别的障碍物 基于异常检测 /开放类别识别的算法研究与工程实现 在非结构化环境(施工区域、道路损坏、落物等)中提升鲁棒性 (三)场景和意图理解 语义分割、实例分割、道路 /车道/交通标志/交通灯等结构物识别 场景理解,例如施工区域识别、可通行区域识别等 意图理解,例如行人动作识别、起步意图识别等 交互和事件识别,例如多方交互、交通规则冲突、非规范驾驶行为等 (四)感知大模型 /多模态 探索或应用预训练多模态大模型,将视觉、语言、地图/文本信息融合以增强感知能力 零样本 / 少样本 / 跨域泛化的策略研发 将大模型成果迁移到真实车队感知系统中,提升复杂场景下的鲁棒性 (五)模型评估、验证 构建完整的评估管道,包括离线评估 + 真实道路 + 模拟环境测试,支持回归检测与性能监控 指标体系设计 (Precision, Recall, IoU, latency, false positives rate 等)

更新于 2026-01-06北京
logo of netease
实习网易云音乐

【职位前言】 DeepSeek-R1的发布给世界带来了不小的震撼,更令人敬佩的是,无论是赶超OpenAI o1的模型效果,还是节省百万美元成本的工程优化,这背后的原理与实现都在官方发布的技术报告和开源项目中一一公开。 大语言模型的前沿研究将不再只是少数巨头才玩得起的项目,更多的研究者可以入局这场对人工智能探索的新征程。 如果您对模型背后的工程优化充满好奇(FP8混合精度训练、分布式专家并行等),想深入了解并上手实践,但又没有合适的计算资源与明确的优化目标,又对模型 post-training(GRPO强化学习、模型蒸馏等等)跃跃欲试,但又没有明确的应用场景和数据资源—— 那不妨来网易云音乐,和我们搭上这趟时代的列车,一起拆解硬核技术,聚焦于音乐业务中的搜索、推荐、广告场景,探索大模型的应用落地与高效部署。 【职位描述】 1、参与大模型在后训练和推理工程中的性能优化,结合底层硬件特性从混合精度训练、矩阵计算加速、注意力机制计算优化、GPU分布式并行等方面提升工程效率; 2、通过强化学习、模型蒸馏等方式,构建音乐领域具有 CoT 推理能力的大语言模型,应用于搜索、推荐、广告等业务场景。 【我们拥有】 1、音乐行业内海量用户独一无二的数据资源; 2、贴近实际的业务场景,让 idea 落地并发挥价值; 3、可观的计算资源,性能上还有极大的空间待与你一同挖掘; 4、鼓励创新探索、倡导悉心钻研、宽松融洽多元的团队氛围; 5、成果转换的支持,合作完成项目及论文,助力未来的职业发展。

更新于 2025-06-17杭州
logo of antgroup
社招技术类-算法

蚂蚁集团是世界顶尖互联网金融科技公司。蚂蚁集团技术研究院致力于做有用、有想象力的科研,负责探索下一代技术前沿,帮助蚂蚁构建下一代技术发动机。 蚂蚁技术研究院深度学习实验,由在深度学习、大模型领域有广泛影响的学者领衔,致力于下一代高准确性、高效率AGI大模型研究和探索,实现世界级的技术创新和影响。团队成员深耕深度学习、大模型领域多年,多位成员具有上万的学术引用。 实验室技术氛围浓厚,适合有探索精神和挑战精神的青年才俊。在这里,你有充分的训练资源和数据资源,有专业的讨论和指导,有和世界领先高校和实验室交互的机会。在优质的成长环境中,可以让你快速成长。 职位描述: 参与下一代AGI大模型的探索和研究,包括但不限于算法创新;技术创新论文的撰写;开源对外;国际会议技术影响交流等;

更新于 2025-06-18北京|杭州
logo of xiaohongshu
实习大模型

本课题的研究目标是增强大模型的通用推理能力,通过研究多模态环境下的推理学习机制、真实世界任务的解决策略、基于强化学习的能力优化,以及构建多样性的奖励系统和训练环境。 研究将聚焦于如何使模型能够在跨领域和复杂场景中综合运用文本、图像、音频等多模态信息进行推理,有效处理现实世界的开放性问题,并通过精心设计的环境反馈机制持续优化模型的决策能力,从而提升AI系统在不同任务下的泛化能力和可靠性。

更新于 2025-08-22上海|北京|杭州