千问研究型算法实习生-多模态大模型（生成、理解&融合模型）

实习兼职日常实习生2026-01-29地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1.计算机科学、人工智能、机器学习或相关专业，博士学历优先；
2. 精通Python编程，熟悉Linux开发环境，具备PyTorch等框架的底层优化经验，能高效实现论文复现及模型改进。

加分项：
1. 在以下领域有系统性研究经验：扩散模型、vlm、融合模型、moe等技术，熟悉HuggingFace…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 参与图像生成、图像编辑和文档理解其中一个方向的工作，围绕效果和速度，通过算法创新持续提升业务天花板；
2. 围绕扩散模型、生成加速、融合模型等方向，不断探索前沿算法，保持方案领先性，助力业务取得效果突破；
3. 围绕数据构建、vae、dit、moe、训练策略等环节，挖掘突破口，持续改进提升。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

机器学习+

学历+

Python+

Linux+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

算法实习生-AIGC多模态生成大模型（研究型）

实习日常实习生

1. 主导或参与图像/视频生成大模型的核心算法研发，聚焦扩散模型及VAE的前沿架构创新优化，完成大规模分布式训练、数据流水线构建及算法工程化部署； 2. 推动视觉生成技术在夸克多产品线的场景化落地，解决实际工程问题，实现从算法原型到工业级系统的端到端优化； 3. 开展前沿算法研究，探索多模态后训练、可控生成及推理加速等方向，保持算法的领先性。

更新于 2026-01-12杭州|上海

研究型实习生-多模态大模型算法工程师

实习阿里巴巴研究型实

阿里巴巴达摩院医疗AI团队，面向多模态医疗大模型的前沿研究与应用落地，旨在构建能够理解和推理不同医疗模态信息（影像、文本、临床结构化数据等）的通用智能系统。研究方向包括但不限于： ● 多模态医疗大模型的架构设计、训练与优化 ● 医学影像（CT/MRI/超声、病理切片等）与医学文本（病历、检验报告等）的跨模态表示学习，多模态对齐，知识图谱增强 ● 医疗领域的视觉‑语言模型（VLM）、医学版GPT及多模态融合方法 ● 面向诊断与治疗决策的推理型模型和知识增强大模型 ● 少样本/零样本医疗任务泛化、可解释性与可信AI 我们拥有： ● 海量高质量、多模态临床数据（影像+文本+结构化信息） ● 充足算力资源（GPU不限，集群规模支持超大模型训练） ● 与国内外顶级医院、知名医学专家的长期科研合作 ● 在顶级会议与期刊（Nature子刊、TMI、MICCAI、CVPR、NeurIPS等）的高影响力成果这是一个将AI大模型与医疗健康结合、面向未来的研究机会。

更新于 2026-06-08杭州

研究型实习生-行为多模态大模型算法

实习阿里巴巴研究型实

1. 参与大模型在行为防控场景中的算法研究与优化工作，针对行为数据多源异构的特点参与包括模型结构设计、训练策略调优等工作 2. 针对行为风控中的意图识别、风险判定等任务，设计并实现高效的模型解决方案 3. 跟踪大模型领域前沿技术进展（如 LLM 微调、RLHF、模型压缩与蒸馏等），并探索在业务场景的落地应用 4. 参与数据清洗、标注策略优化和评估体系建设，持续提升模型效果

更新于 2026-03-23杭州

研究型实习生-多模态医疗大模型算法工程师

实习阿里巴巴研究型实

阿里巴巴达摩院医疗AI团队，面向多模态医疗大模型的前沿研究与应用落地，旨在构建筛查-诊断-治疗全流程大模型和Agent系统。研究方向包括但不限于： ● 多模态医疗大模型的架构设计、训练与优化 Agent系统设计、训练和优化 ● 医学影像（CT/MRI/超声）与医学文本（病历、检验报告等）的跨模态表示学习，多模态对齐，知识图谱增强 ● 医疗领域的视觉‑语言模型（VLM）、医学版GPT及多模态融合方法 ● 少样本/零样本医疗任务泛化、可解释性与可信AI 我们拥有： ● 海量高质量、多模态临床数据（多模态影像+文本+结构化信息） ● 与国内外顶级医院、知名医学专家的长期科研合作 ● 在顶级会议与期刊（Nature子刊、TMI、MICCAI、CVPR、NeurIPS等）的高影响力成果这是一个将AI大模型与医疗健康结合、面向未来的研究机会。

更新于 2026-07-02杭州