字节跳动3D视觉研发实习生-智能创作

实习兼职A290142025-02-17地点：北京状态：招聘

扫码手机上打开

任职要求

1、2026届硕士及以上学位在读，计算机、电子信息、软件工程等相关专业优先；
2、在计算机视觉某个领域有较深入的研究，包括但不限于：视频生成、3D生成、3D重建、3D数字人、3D视觉等；对深度学习算法有深刻理解，熟悉常用深度学习框架；
3、具备快速学习新技术的能力，能够在较短时间内理解前沿论文并评…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

ByteIntern：面向2026届毕业生（2025年9月-2026年8月期间毕业），为符合岗位要求的同学提供转正机会。
团队介绍：智能创作团队是字节跳动创作场景业务中台，负责了抖音、剪映等产品的技术和业务研发，涵盖了计算机视觉、深度学习、高性能计算、图形学、特效引擎等技术领域，并以多种形式向公司内部各业务线提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案，同时通过火山引擎为企业客户提供服务。

1、参与3D视觉与多模态生成结合的相关算法研发与优化，包括3D生成、视频生成等，跟进计算机视觉领域的前沿技术研究；
2、参与和推动上述相关技术在抖音、剪映、火山引擎等产品线的落地。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

OpenCV+

还有更多 •••

登录查看完整学习资料

相关职位

蚂蚁集团-集合通信研发工程师/专家-杭州/成都/北京

社招3年以上技术类-开发

我们是蚂蚁集团网络技术团队，为蚂蚁集团全站提供通智一体、稳定高效的网络基础设施产品、平台和服务。 ● 负责集合通信库的设计和研发； ● 通过稳定性建设和通信优化提升大模型训练效率和减少推理成本；

更新于 2025-04-03北京|杭州|成都

高德-高级几何算法工程师/专家-车道级导航-APP平台业务

社招1年以上技术类-地图

部门介绍：业界领先的地图渲染团队，新一代智能导航的领军者。核心目标是通过导人、导车的产品形态落地，核心技术能力的升级创新，持续为导航、打车、信息、汽车的地图渲染、车道级导航、AI应用提供引擎能力支撑；还有面向未来的云渲染、数字孪生等方向的探索；团队专注地图渲染研发，技术氛围浓厚、追求产品极致，以连接真实世界，服务于广大用户的出行和生活。部门亮点： ● 车道级导航业界领先，利用几何建模技术，最早实现了人车共导和沉浸式导航。 ● 3D视界，采用游戏化实时渲染技术，结合AI技术，创新性实现了时空互联地图。 ● 顶流产品所需要的渲染技术、图形学、几何建模等业界难题等你来挑战。岗位职责： 1. 负责3D空间关系构建与建模算法研发； 2. 负责几何图形算法的架构设计与落地； 3. 负责道路数据的精细化渲染研发。

更新于 2025-04-03北京

高德-AIGC多模态生成&理解算法工程师/专家-北京

社招3年以上技术类-算法

团队介绍：高德地图机器学习研发部是公司AI核心技术引擎，聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地，支撑亿级用户产品，同时长期投入前沿探索，在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文，多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源，鼓励创新突破，诚邀你与顶尖算法专家并肩，共同定义AI的未来！如果你渴望挑战多模态与生成式AI的技术巅峰，在视频、图像、大模型的交叉领域实现突破，欢迎加入我们！团队的github页面是：https://github.com/AMAP-ML/ 我们提供 • 参与亿级用户产品的AI核心算法研发，见证技术直接赋能业务； • 与学术大牛和工业界专家共事，持续提升技术视野； • 顶配算力资源+开放创新氛围，支持前沿探索与顶会论文发表。具体职责包括但不限于： 1. 视频生成：负责视频生成技术的前沿技术的研究，对AIGC的diffusion和auto-regressive技术有深入了解，在T2I/AIGCT2V/I2V上面有一定的研究，图文对齐，长视频生成等有一定的研究，做好视频生成在高德业务（广告，POI详情页等）中的进行落地。 2. 视频理解：能够使用和优化多模态大模型对用户上传的视频进行质量理解，标签，densecaption，视频summary等生成，作用到视频的搜索，广告，推荐等业务的落地。 3. 世界模型：参与世界模型的构建，能够使用最新的视频生成技术，3D技术等构建符合人类物理规律的统一的世界模型，在高德的业务进行落地。 4. 紧跟技术前沿和技术沉淀，形成顶会论文和专利。

更新于 2026-01-23北京

优酷-嵌入式软件开发技术专家-深圳

社招5年以上

1、嵌入式AI系统开发： • 负责RTOS系统平台上多模态AI终端产品的研发，包括方案评估、软件架构设计、核心功能模块（如人脸/手势识别、行为分析）开发与部署； • 主导端侧AI模型轻量化、跨平台推理框架适配（TensorFlow Lite/MNN/NCNN）及NPU芯片的性能优化（如内存、功耗、实时性）； • 结合硬件特性设计轻量化模型架构，完成从算法训练到嵌入式端侧部署的全链路开发。 2、多模态算法工程化： • 优化计算机视觉算法在嵌入式设备（IoT/AR硬件/AI机器人）的落地效果，解决低算力、高延迟、多干扰场景下的工程挑战； • 开发芯片算子库适配方案，参与芯片选型、AI工具链优化及端云协同架构设计； • 探索多模态交互（视觉+语音+传感器）在智能终端的创新应用，如AI玩偶、陪伴机器人等。 3、跨团队协作与交付： • 与芯片厂商、算法团队、硬件团队协同开发，主导端侧SDK集成及性能调优，确保产品按时交付； • 支持产品量产落地，保障系统稳定性与用户体验。

更新于 2025-04-02深圳