地平线视频生成算法实习生

实习兼职算法序列2025-06-25地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1、硕士及以上学历，计算机科学、图形学、自动化、人工智能等相关专业背景；
2、熟悉主流生成模型架构（如 Diffusion、Flow Matching、AutoRegressive 等），具备扎实的模型训练与微调经验；
3、熟练掌握 Python 编程语言，精通 PyTorch 等主流深度学习框架，熟悉 Huggingfa…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、参与机器人视频生成方向的研究与系统开发，涵盖数据准备、模型训练与实机验证等环节；
2、通过数据合成与生成-理解一体化的预训练方法，提升具身智能系统的泛化能力与任务通用性；
3、跟踪视频生成与多模态领域的前沿研究进展，探索面向具身智能关键问题的创新解决方案，撰写高质量技术文稿，推动成果在国际顶级会议（如 CVPR、NeurIPS 等）发表。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Python+

PyTorch+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

电商资深推荐算法工程师

社招5-10年J0011

1、参与亿级用户规模的电商推荐优化，提升包括商品推荐(首页猜你喜欢)、内容推荐(直播、短视频)在内的泛货架电商的GMV、订单量、用户留存等核心指标； 2、通过深度学习领域的研发工作，包括但不限于生成式推荐、LLM4Rec、超大规模序列建模、多任务学习、长期价值建模等算法和系统提升预估效果； 3、持续关注前沿技术发展方向，参与推荐系统架构的长期技术演进与技术攻坚； 4、通过推荐算法机制优化电商流量结构和GMV结构，促进电商生态的健康发展。

更新于 2026-03-30北京

平台算法实习生（网易云音乐）

实习网易云音乐

我们是网易云音乐算法团队，专注于行业领先的搜索或者推荐算法，我们致力于通过技术赋能云音乐各项业务，通过社区广场推荐，提升用户体验，产生商业化价值。在这里你可以： 1、参与云音乐各场景相关的AIGC算法应用，使用NLP、多模态、LLM等技术，优化包括多模态内容理解、大模型交互式对话、大模型AI创作生成等业务应用的效果提升； 2、参与云音乐创新业务相关的算法优化，使用业界领先的深度学习、强化学习、图模型等，优化推荐、直播、声音、社交等业务的算法； 3、参与前沿的基础算法模型建设，包括继续预训练、视频生成微调，音乐生成训练等垂类基座模型的构建和应； 4、接触到亿级别海量、真实的用户数据，使用深度学习、强化学习、图模型等算法，发挥推荐的价值； 5、使用行业领先的大规模分布式机器学习平台，例如tensorflow等开源的工具，实现并不断优化推荐、搜索等算法。

更新于 2025-06-30杭州

数字人研发工程师（J78151）

社招TPG

-负责计算机视觉和深度学习算法的开发与性能提升，研究的问题包括但不限于虚拟人-基于DIffusion model的2D/3D虚拟人的表情/肢体驱动、生成模型-多模态的图像/视频生成与编辑 -行业内相关的实习、高校实验室、研究所研究、以及工作经验 -有与图形学、计算机视觉、机器学习等研究相关的开源项目的贡献背景 -在国际顶尖会议或期刊（CVPR、ICCV、ECCV、3DV、 SIGGRAPH、TOG、TPAMI）发表相关论文 -主动性强，在具有挑战性的研究问题上不断深耕并达到业界顶尖水平

更新于 2024-08-09北京|上海|深圳

【Ace顶尖实习生】基于MLLM的创作向深度思考能力提升

校招AIGC算法

目前主流的素材混剪能力主要依赖于素材的端内容理解、表征匹配、高光检测等能力帮助一键完成整个视频剪辑过程，偏模板化，且预定义较为死板，无法支持更丰富的信息量注入，以及用户自主输入剪辑要求。本课题希望通过大语言模型的语义指令解析能力，开放基于可自定义prompt的视频编辑能力，通过指令分解、协同主题文案生成的方式，帮助完成带有故事感文案生成能力的视频剪辑功能。主要的技术难点包括： 1、多模态理解与表征：需要模型能够深入理解不同模态内容(视频片段、图像、音频)的语义和上下文； 2、时序理解与编辑：视频混剪需要理解时序信息，包括情节发展、节奏感、转场点等； 3、文案生成和改写：可自定义主题、风格的素材文案生成能力。

更新于 2026-03-24北京|杭州|上海