通义通义实验室-多模态理解算法专家-杭州/北京
社招全职3年以上技术类-算法地点:北京 | 杭州状态:招聘
任职要求
1、计算机科学、人工智能、机器学习或相关领域的硕士或博士学位; 2、在多模态、计算机视觉、NLP、AIGC、计算机图形学、机器学习等一个或多个领域有较深入的研究; 3、具有出色的分析、解决问题的能力,能深入解决大模型训练、应用存在的问题,有自主探索解决方案的能力者; 4、能够积极创新, 乐于面对挑战, 负责敬业,优秀的团队合作精神,一起探索新技术,推进技术进步。 加分项: 1、具有优秀的基础算法、扎实的…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、 探索研究多模态理解、计算机视觉、自然语言处理等前沿技术; 2、参与研发多模态、全模态大模型等下一代人工智能核心技术,探索大规模/超大规模多模态理解与生成统一的基础模型,提升大模型能力; 3、负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。
包括英文材料
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
学历+
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
AIGC+
https://ui.adsabs.harvard.edu/abs/2023arXiv230406632W/abstract
To address the challenges of digital intelligence in the digital economy, artificial intelligence-generated content (AIGC) has emerged.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
CVPR+
https://cvpr.thecvf.com/
还有更多 •••
相关职位
社招1年以上技术类-算法
1. 探索研究多模态理解、计算机视觉、自然语言处理等前沿技术; 2. 参与研发多模态、全模态大模型等下一代人工智能核心技术,探索大规模/超大规模多模态理解与生成统一的基础模型,提升大模型能力; 3. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。
更新于 2025-08-19北京|杭州
社招4年以上技术类-算法
1. 参与前沿AI技术探索与行业级产品落地的双轨发展战略,与顶尖团队协作攻克多模态理解与生成智能体系统的技术挑战,推动多模态RAG与智能体技术的产品化落地; 2. 设计并实现融合文本、图像、语音、视频等多模态数据的检索增强生成系统,优化跨模态语义对齐与知识检索能力; 3. 设计基于多模态大模型的智能体核心算法,实现任务规划、意图识别、工具调用及多智能体协作系统。
更新于 2025-10-22北京|杭州
社招2年以上技术类-算法
1. 探索研究多模态理解、多模态生成、计算机视觉、自然语言处理、音频等前沿技术; 2. 参与研发多模态、全模态大模型等下一代人工智能核心技术,探索大规模/超大规模多模态理解与生成交织的基础模型,提升大模型能力; 3. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。
更新于 2025-07-04北京|杭州