阿里巴巴未来生活实验室-AIGC算法工程师
实习兼职淘天集团日常实习生批次地点:北京 | 杭州状态:招聘
任职要求
1. 计算机、数学、自动化、电子信息、人工智能等相关专业的全日制在读硕士/博士(2026年及以后毕业); 2. 具备基本的计算机视觉/机器学习/深度学习等相关理论功底; 3. 有相关方向的项目经验或者顶会论文发表者优先(如CVPR/ICCV/ECCV/NeurIPS/ICLR等); 4. 能够线下全职实习,实习时间至少6个月以上,能长期实习者优先。
工作职责
拍立淘是阿里电商核心视觉搜索算法团队,致力于为淘宝搜索核心业务打造行业领先的计算机视觉创新技术,应用于多种电商场景(如拍照搜同款、电商创意AIGC、电商大模型),堪称国内最大的视觉算法应用场景之一。我们紧随技术潮流,不断进行商业和技术创新,期待有志之士的加入,让算法发挥价值,让技术更有影响力。 【招聘方向】 1. AIGC视觉生成(包括但不限于可控图像/视频生成、图像/视频编辑、图像驱动、定制化、试衣等); 2.多模态大模型(包括但不限于大模型预训练、垂域微调SFT、RLHF、数据治理飞轮、训练部署加速等); 3.图像/多模态理解(包括商品多模态理解VG、目标检测、OCR、图像/多模态表征等),其他任何感兴趣/有价值的方向欢迎交流讨论。 【实习工作环境】 1. 充裕的GPU资源,近千张A100/V100 海量业务数据和基础能力积累,帮助高效产出; 2. 来自国内外top学校的师兄/师姐的倾力指导充分尊重实习生个人意见,自由度高; 3. 产研结合,支持鼓励实习生投递顶会论文。
包括英文材料
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
CVPR+
https://cvpr.thecvf.com/
ICCV+
https://iccv.thecvf.com/
ICCV is the premier international computer vision event comprising the main conference and several co-located workshops and tutorials.
ECCV+
https://eccv.ecva.net/
ECCV is the official event under the European Computer Vision Association and is biannual on even numbered years.
NeurIPS+
https://neurips.cc/
ICLR+
https://iclr.cc/
相关职位

社招
1. 主导多模态生成算法(图像 / 视频 / 3D 等)的设计与优化,聚焦生成质量提升、多样性拓展、可控性强化及可编辑功能实现,攻克技术瓶颈; 2. 深度结合游戏研发与发行业务需求,提供通用性技术框架或定制化算法方案,解决 AIGC 在实际落地中的适配性、效率及效果问题,推动技术转化; 3. 密切追踪多模态与 Generative AI 领域前沿动态(如模型架构、训练策略等),结合业务痛点设计创新性算法路径,保持技术竞争力。
社招
面向AIGC领域,研发前沿的视频生成与处理算法,结合短视频、电商、品牌创意等具体业务场景,进行系统性算法设计,推动自动化剪辑、视频生成、动作迁移、语义驱动等能力落地; 针对当前大模型视频生成中的痛点(如帧一致性、时空建模、长视频连贯性、跨模态对齐等),优化扩散/生成架构、设计稀疏高效推理策略,提高生成质量和响应速度; 开发用于视频创作的底层算法与工具链,包括视频分镜生成、关键帧补全、文本驱动编辑(text-driven editing)、镜头分割与结构化剪辑等能力模块; 持续追踪业界前沿(如Sora、Runway、Kling、Veo等),快速完成benchmark与迁移落地; 深度理解视频内容生产到多渠道分发的完整链路,与产品、运营、创意团队协同,构建适配业务的AI视频引擎与应用原型。
更新于 2024-09-27
社招技术类
1、探索AIGC技术的相关技术,包括图片生成、视频生成、语音合成、数字人、智能对话等领域; 2、结合业务场景,设计并实现AIGC相关的算法和模型; 3、参与AIGC技术的性能优化和工程化工作; 4、持续学习和跟踪AIGC技术的最新进展,为团队提供技术支持和指导。
更新于 2025-10-08