logo of tongyi

通义Token Foundry-多模态生成算法专家/高级专家-杭州/北京

社招全职3年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学、人工智能、机器学习或相关领域的硕士或博士学位。
2. 在扩散模型、自回归模型、多模态生成理解、计算机视觉NLP、AIGC、计算机图形学、机器学习等一个或多个领域有较深入的研究。
3…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 探索研究多模态生成大模型的设计与开发,探究高效生成、生成理解统一、多模态理解、强化学习/RLHF后训练和高效数据管线设计等方向。
2. 参与研发多模态生成大模型开发等下一代人工智能核心技术,参与大规模生成基础模型预训练与后训练开发。
3. 负责跟踪和研究多模态生成大模型前沿技术调研、落地、对业务进行优化。
包括英文材料
机器学习+
学历+
OpenCV+
还有更多 •••
相关职位

logo of tongyi
社招3年以上技术类-算法

1. 探索研究多模态生成大模型的设计与开发,探究高效生成、生成理解统一、多模态理解、强化学习/RLHF后训练和高效数据管线设计等方向。 2. 参与研发多模态生成大模型开发等下一代人工智能核心技术,参与大规模生成基础模型预训练与后训练开发。 3. 负责跟踪和研究多模态生成大模型前沿技术调研、落地、对业务进行优化。

更新于 2026-06-12北京|杭州
logo of tongyi
社招3年以上

【部门介绍】 随着大模型技术的飞速发展,理解和生成多模态数据(图像、视频、音频、3D素材等)的能力日益增强。目前,构建能够同时进行输入和输出的多模态世界模型已成为业界的研究热点,也是实现通用人工智能(AGI)的重要技术路径之一。 万相Wan将持续在世界模型、原生多模态预训练、理解-生成融合范式、统一Tokenizer研究、人类反馈与强化学习等前沿技术方向上进行探索,始终追求在多模态世界模型领域的领先研究地位,致力于建立世界级的技术影响力。 【工作内容】 1、负责原生多模态模型研究和开发,结合多模态能力(支持文本、图像、语音输入)实现复杂指令生成,包括但不限于文生图、图生图、文档生成、可控编辑等核心方向。 2、负责图像生成模型效果优化,探索扩散模型、自回归模型结构和策略优化等核心技术课题。 3、负责人类反馈与强化学习,聚焦于更加精细的RL算法设计,并基于万相用户反馈的RLHF图像生成质量提升。

更新于 2026-06-09北京|杭州
logo of tongyi
社招3年以上产品类-商业型

1. 多模态AI产品战略规划与设计:主导基于多模态理解与生成大模型的行业级应用产品规划,深入垂直场景,精准洞察客户痛点与商业机会,定义具备规模化潜力的公共云多模态AI产品(如MaaS平台、智能Agent等),持续丰富产品矩阵与市场供给。 2. 端到端产品落地与跨职能协同:牵头算法、工程、解决方案及销售团队,推动产品从需求定义、原型验证到上线运营的全生命周期管理,确保高质量交付与敏捷迭代;建立效果与性能评估体系,驱动模型能力与产品体验的持续优化。 3. 商业化运营与价值闭环构建:对产品的规模增长、客户渗透率及市场占有率等核心商业指标负责,通过用户分析、测试与反馈闭环,持续优化产品策略与定价模型,推动标杆案例打造与规模化复制,实现产品商业价值最大化。 4. 技术趋势研判与产品竞争力塑造:持续跟踪全球多模态大模型技术演进与应用创新,研判MaaS、Agent、具身智能等新范式的产品化路径;定义并监控产品在效果、成本、易用性等维度的关键竞争力指标,构建差异化产品壁垒。

更新于 2026-06-09杭州
logo of tongyi
社招3年以上技术类-开发

1. 前沿模型架构研发:负责大模型前沿架构(如 Linear Attention、原生多模态、MoE 等)的底层工程实现。深度参与算法底层逻辑重构,将前沿理论模型转化为高性能的训练与推理模型。 2. 复杂算子优化与系统级重构:针对非标准及新型算法架构,设计并实现深度定制化的分布式算子。通过重构核心计算组件,解决超大规模模型在异构算力集群下的瓶颈问题,打造具备极致响应速度和吞吐能力的推理后端。 3. 大规模并行策略与资源调度:设计并落地匹配复杂架构的计算并行策略(TP/PP/EP/CP)及精细化显存管理方案。持续优化大规模集群通信机制,降低通信开销,确保在算力池中实现模型的高效、稳定运行。

更新于 2026-06-09杭州