
Momenta端到端大模型算法实习生(Mstar)
任职要求
1. 计算机、软件工程、机器人、自动化等相关专业硕士及以上学历; 2. 具备数据驱动算法的研发能力,熟练相关技术栈,包括C++、Python,某种训练框架,如PyTorch; 3. 掌握相关领域的基础知识,算法基础(机器学习、深度学习、强化学习等)、数理基础; 4. 具有相关领域(如CV、NLP、PNC都可)的论文发表、业务研发经验。
工作职责
1. 设计并实现端到端智驾大模型,整合感知、规划与决策功能,提升模型的整体性能与效率; 2. 运用深度学习、强化学习、机器学习等技术,优化模型结构,提高模型对复杂驾驶场景的理解和应对能力; 3. 负责收集、标注和处理自动驾驶相关数据,构建高质量的数据集,为模型训练提供有力支持; 4. 利用数据增强、迁移学习等方法,提升数据利用效率,优化模型的泛化能力; 5. 跟踪自动驾驶和人工智能领域的最新研究成果,探索新技术在端到端大模型中的应用可能性。

1.研发基于多传感器(激光雷达、摄像头等)的4D时空场景重建和生成算法,融合时序信息实现动态物体和静态场景高精度建模; 2.研发场景生成、可交互视频生成等技术,支持自动驾驶场景的高保真场景生成,用于端到端自动驾驶算法的闭环仿真和强化学习训练; 3.结合闭环仿真结果,对场景生成相关算法进行迭代,推动端到端自动驾驶系统的联合优化。
1. 研究和开发先进的机器学习算法, 应用于智能辅助驾驶的各个领域,包括但不限于: - 端到端大模型 (VLA、世界模型等) - 环境感知 (目标检测、语义分割、多传感器融合等) - 决策规划 (路径规划、行为预测、运动控制等) 2. 探索和实现前沿的人工智能技术, 如深度学习、强化学习、计算机视觉、自然语言处理等,以提升智能辅助驾驶系统的性能、安全性和可靠性。 3. 设计和开发大规模数据集, 用于训练和评估智能辅助驾驶算法。
【】 1、负责语音合成系统/语音端到端大模型、全链路算法的技术预研和研发工作。 2、负责大模型的数据积累、框架建设等基建工作。 3、跟踪业界前沿技术,持续探索语音合成、端到端技术的新能力和新应用,提升核心能力。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、承担抖音内多元语音交互场景中的语音模型需求,涵盖抖音AI分身音视频对话、客服热线、VOIP场景下的相关音频算法研发工作;包括对语音识别、合成、对话理解等模型展开针对性训练与优化,全力提升对话效果及语音合成稳定性和表现力; 2、深入探索端到端语音大模型的落地与优化举措,致力于降低语音交互延时,显著提升语音对话品质;同时,专注于语音合成/音频AI生成相关算法模型的研发与精进,跟进语音领域前沿技术研究,负责音频表征模型、Seq2Seq底膜的研发优化; 3、紧密跟踪研发业界先进的音频技术进展,积极探索语音/音频领域最新技术,并推动其成功落地于抖音产品之中。