阿里巴巴算法工程师-视觉AIGC
实习兼职淘天集团2026届春季实习生招聘地点:杭州状态:招聘
任职要求
【必备项】 ● 学历背景:本科及以上学历,计算机科学、人工智能、电子与通信等相关专业优先; ● 技术能力: 熟悉计算机视觉、机器学习、图像/视频分析与处理、多模态内容理解、AIGC等相关领域技术和应用; 具备扎实的工程实现能力,熟练掌握C/C++、Java、Python等至少一门编程语言; 了解并使用过torch、tensorflow等深度学习开发工具; ● 学习与思考:拥有极强的学习能力,对新技术充满好奇心,善于独立思考并总结经验; ● 沟通与协作:具备良好的沟通能力和团队合作精神,乐于分享知识,能够高效协同完成复杂任务。 【加分项】 ● 在校园内或互联网公司有相关实习或项目经历,尤其是涉及图像生成编辑、内容理解、视频生成编辑或多模态学习的项目; ● 在ICCV、CVPR、NeurIPS等国际顶级会议或期刊发表过论文,或在相关学术竞赛(如Kaggle、ImageNet等)中取得优异成绩; ● 对扩散模型、生成式AI、虚拟试穿等前沿技术有深入研究或实践经验。
工作职责
如果你渴望投身于AI技术驱动的未来,并希望通过算法与系统研发改变亿级用户的内容体验,那么这里将是你实现梦想的最佳舞台!在淘天集团,我们正在构建一个基于海量图像/视频数据的智能生态,覆盖内容理解、匹配分发、生成等多个核心方向。作为团队的一员,你将参与以下前沿领域的探索与实践: ● AIGC(AI-Generated Content)创新:探索扩散模型(SD、flux系列)、自回归生成(AR)、强化学习、多模态生成技术等前沿方法,打造下一代智能化内容生成工具,赋能电商、娱乐、广告等多个场景。 ● 跨领域联合创新:结合计算机图形学、物理仿真和大语言模型等技术,推动虚拟试穿、3D内容生成、基于文本描述的通用图像编辑、动态视频生成编辑等应用落地,开创视觉技术的新格局。 在这里,你不仅能够接触到行业最顶尖的数据资源,还能与一群聪明、皮实、乐观、自省、追求卓越的伙伴一起,探索未知、突破边界,共同定义视觉技术的未来! 为什么选择我们? ● 海量数据与真实场景:依托淘天集团丰富的业务场景,你将有机会在亿级图像/视频数据上验证你的算法,并看到它们如何直接影响用户的生活。 ● 前沿技术与创新氛围:我们鼓励大胆尝试、快速迭代,支持你在机器学习、深度学习、计算机视觉、AIGC等领域的深入研究。 ● 成长与发展机会:无论你是希望深耕技术成为领域专家,还是逐步转型为技术管理者,我们都会为你量身定制适合的成长计划。 ● 顶级资源支持:无论是计算资源、数据资源,还是与行业顶尖专家的合作机会,我们都将全力支持你的成长。
包括英文材料
学历+
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
C+
https://www.freecodecamp.org/chinese/news/the-c-beginners-handbook/
本手册遵循二八定律。你将在 20% 的时间内学习 80% 的 C 编程语言。
https://www.youtube.com/watch?v=87SH2Cn0s9A
https://www.youtube.com/watch?v=KJgsSFOSQv0
This course will give you a full introduction into all of the core concepts in the C programming language.
https://www.youtube.com/watch?v=PaPN51Mm5qQ
In this complete C programming course, Dr. Charles Severance (aka Dr. Chuck) will help you understand computer architecture and low-level programming with the help of the classic C Programming language book written by Brian Kernighan and Dennis Ritchie.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
ICCV+
https://iccv.thecvf.com/
ICCV is the premier international computer vision event comprising the main conference and several co-located workshops and tutorials.
CVPR+
https://cvpr.thecvf.com/
NeurIPS+
https://neurips.cc/
Kaggle+
[英文] Kaggle Learn
https://www.kaggle.com/learn
Gain the skills you need to do independent data science projects.
相关职位
校招2025届秋季正
优酷拥有海量的图像/视频数据,强大的计算能力和巨大的市场空间。我们需要你具有计算机视觉相关基础知识和视觉分析、诊断、搜索、合成等方面的实践经验。我们期待聪明、乐观、皮实、自省、追求卓越和自我驱动的优秀人士加入优酷,共同开创视觉技术的新格局。 具体职责包括但不限于: 1、负责图像/视频的分析、诊断、搜索、合成等方面的算法研究、系统研发和产品开发,包括图像检测、图像分类、图像分割、图像跟踪、视频语义分析、人脸识别与分析、车辆与人员的检测识别与跟踪、工业与医学诊断、图像/视频搜索、页面分析与自动合成、OCR等 2、负责图像/视频相关算法的前沿技术探索,包括机器学习方法以及深度学习在机器视觉中的应用,以及计算机视觉与自然语言处理、计算机图形学等相关领域的联合创新
更新于 2025-02-13
实习虎鲸文娱2026
优酷拥有海量的图像/视频数据,强大的计算能力和巨大的市场空间。我们需要你具有计算机视觉相关基础知识和视觉分析、诊断、搜索、合成等方面的实践经验。我们期待聪明、乐观、皮实、自省、追求卓越和自我驱动的优秀人士加入优酷,共同开创视觉技术的新格局。 具体职责包括但不限于: 1、负责图像/视频的分析、诊断、合成、编辑等方面的算法研究,多模态大语言模型的有监督微调等; 2、负责图像/视频/3D相关算法的前沿技术探索,包括图像/视频/3D生成和可控编辑领域的联合创新。
更新于 2025-05-06
实习虎鲸文娱2026
1、研究和探索可控的视觉内容生成技术,负责视觉内容生成模型等相关算法的研发和落地,结合公司业务场景进行相关策略迭代; 2、探索时空内容可控生成技术,包括图片/视频风格迁移、镜头控制、空间一致性控制等; 3、持续跟踪图像和视频生成领域的最新技术动态,评估并实施前沿技术,推动技术在公司产品中的应用与创新。
更新于 2025-05-06