logo of tongyi

通义研究型实习生 - 基于生成理解一体化的前沿具身智能大模型和数字人大模型

实习兼职通义研究型实习生地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学、人工智能、机器人学、自动化、人机交互或相关专业在读博士研究生;
2. 扎实的深度学习大模型基础,熟悉Transformer、扩散模型、自回归生成、多模态对齐等核心技术;
3. 熟练掌握Python,具备PyTorch/JAX等框架下的模型训练…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


我们是通义实验室多模态交互团队,正在寻找对具身智能与数字人前沿交叉领域充满热情的研究型实习生。本项目在团队在生成理解一体化方面的坚实基础(如Z-Image等代表性工作),共同构建下一代具身智能与多模态数字人大模型,进一步打通“感知-理解-生成-执行”全链路,在统一架构下探索环境理解、行为生成与多模态交互的深度协同。
你将参与如下关键方向:
1. 设计并实现支持自然语言指令到连续动作序列端到端控制的生成理解一体化具身基础模型;
2. 构建能响应语音、文本、视觉等全模态输入,实时高质量数字人生成大模型;
3. 开发融合真实与仿真数据的千万级多模态具身训练平台;
4. 优化模型推理效率,推动大模型在机器人端侧或实时交互场景中的部署。

优秀成果可形成专利/论文,或发布通义开源社区
包括英文材料
深度学习+
大模型+
Transformer+
Python+
PyTorch+
JAX+
数字人+
还有更多 •••
相关职位

logo of alibaba
实习淘天集团研究型实

【加入前沿战场,定义下一代增长引擎】 在阿里妈妈AI Agent与客户成长团队,我们正用最前沿的Agent技术重构数智化营销生态。 作为团队新生力量,你将直接参与构建日均服务百万级商家的智能增长系统,通过大模型技术实现从用户意图洞察到智能决策的全链路突破。 在这里,你的代码将直接影响中国电商生态的广告决策效率,用AI重新定义商业增长的可能性。 【你将主导的挑战】 智能增长系统攻坚 ● 设计基于LLM的个性化增长策略矩阵,覆盖智能触达、流失预警、投放引导等核心场景。 ● 构建多模态商业理解引擎,融合时序预测(LTV建模)、因果推断(Uplift建模)、生成式优化等创新技术。 ● 主导端到端的AI Agent架构设计,攻克动态Prompt生成、多轮对话决策等关键技术节点。 数据驱动的技术突破 ● 操盘亿级用户行为数据,通过大规模A/B实验验证模型效果,你的每个优化将直接提升DAU/留存率等核心指标。 ● 探索大模型微调+RAG+Agent框架的技术融合,打造行业领先的智能运营解决方案。 【超维成长体验】 三位一体培养体系 ● 双导师制成长:算法大牛+业务专家贴身指导,定期论文精读与代码Review。 ● 全真项目历练:独立负责子模块开发,6个月挑战完整项目生命周期。 ● 前瞻技术视野:参与内部技术峰会,第一时间获取阿里妈妈AI最新研究成果。

更新于 2026-01-16北京
logo of antgroup
实习研究型实习生

研究领域: 遥感 项目简介: 基于国产为主的卫星影像等时空数据,支持遥感多模态大模型的建设,研究新一代遥感基础模型的关键技术,应用在农业遥感等场景。在农业制图、农作物监测等专业领域跟进行业前沿并进行技术创新,协同全流程的工程开发,做出AI技术在该领域的落地示范。

北京|杭州
logo of tongyi
实习通义研究型实习生

以OpenAI ChatGPT为代表的文本大模型激起了大模型的热潮。文本大语言模型的技术突破,也在深入的影响着音频领域的研究。如何让大语言模型不仅有“读”和“写”的能力,同时有“听“和“说”的能力,让其具备类似人类对音频信号的感知和理解能力,是一个具有重要科研价值和实际意义的研究方向。

更新于 2024-11-14北京|杭州
logo of aliyun
实习阿里云研究型实习

自然文本生成是大语言模型在应用落地时最具前景的方向之一,文本摘要、文本扩写和文本润色等能力可以将用户从繁重枯燥的文宇工作中解放出来,显著提高用户的工作效率和行业的生产效率。本项目旨在探索自然文本生成还存在以下若干难题: 1)知识注入的问题:大语言模型需要高质量的数据进行训练,然而现有的通用和行业数据体系的构建相对落后,我们希望通过创新的算法从大量原始的、质量参差不齐的数据中自动挑选高质量数据进行训练,同时通过数据浓度和学习进度的调控平衡大语言模型在各个方向的文本生成能力; 2)知识应用的问题:部分行业如政务、医疗对生成文本的相关度和真实性有很高的要求,然而大语言模型在理解长文本和生成长文本时,存在抓不住重点和生成幻觉的问题; 3)知识评估的问题:文本生成的内容目前仅能依靠人工的方式进行评测,限制了评测的范围和算法迭代的速度。我们希望模型辅助评测的方式,实现半自动乃至全自动的评测。

更新于 2024-07-12杭州