logo of tongyi

通义通义实验室-高级算法专家(人类偏好对齐方向)-通义万相

社招全职5年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学、人工智能、机器学习能等领域的博士/硕士毕业生。
2. 对多模态生成方向具有技术热情、良好的技术洞察力和优秀的业务分析能力,能应对复杂的业务算法需求。
3. 掌握机器学习深度学习基础知识,有较强的代码能力,掌握SQLPython等常用开发语言和环境。
4. 踏实心细,对模型评测/RL/大模型数据构建有热情,对相关领域有足够的认知和思考,提升团队模型迭代效率。
5. 有良好的协作能力,与算法、工程、数据等团队紧密合作,系统性建设高效的工作流。
6. 关注技术影响力,具有开源开放精神,对基础模型的前沿问题有持续热情,有追求,渴望做出有极大影响力的工作。

工作职责


【部门介绍】
随着大模型技术的飞速发展,理解和生成多模态数据(图像、视频、音频、3D素材等)的能力日益增强。目前,构建能够同时进行输入和输出的多模态世界模型已成为业界的研究热点,也是实现通用人工智能(AGI)的重要技术路径之一。
通义万相(Wan)将持续在世界模型、原生多模态预训练、理解-生成融合范式、统一Tokenizer研究、人类反馈与强化学习等前沿技术方向上进行探索,始终追求在多模态世界模型领域的领先研究地位,致力于建立世界级的技术影响力。

【职位描述】
1. 负责通义万相多模态世界模型的Reward Model构建,包括但不限于:基模型评价维度和benchmark构建,构建强化学习Reward Model和有效RL算法,结合线上用户反馈挖掘模型缺点、持续迭代,实现和人类评测和偏好对齐。
2.负责通义万相多模态世界模型的数据建设,包括但不限于:视频、图像、音频、文本等多模态数据集建设,人类偏好数据pipleline建设,为图像模型、音视频模型、交互式世界模型等基础模型迭代提供有效数据供给。
包括英文材料
机器学习+
算法+
深度学习+
SQL+
Python+
大模型+
相关职位

logo of alibaba
社招2年以上技术类-算法

【职位描述】: 1、负责AI产品开发与应用:围绕外贸商品构建B类商品模型、AI发品、负向治理等能力; 2、技术能力:电商领域多模态大模型,包括从监督微调(SFT)到强化学习人类反馈(RLHF)的全链路技术构建,以及智能Agent系统,涵盖但不限于检索增强生成(RAG)系统、Agent系统和工作流推理等。 3、推动跨境电商AI创新业务的落地实施,包括高效的商品AI大模型、AI发品和诊断Agent等解决方案。 4、开展前沿LLM技术的探索,持续迭代和优化自研模型能力,以支持AI原生产品的实施。

更新于 2025-09-22
logo of eleme
社招4年以上设计类-用户体验

1. 进行饿了么相关业务线用户洞察相关工作, 支持公司及运营、产品、技术算法、设计等不同职能部门策略制定及优化,推动业务健康高效发展; 2. 结合传统调研方法、大数据分析及各种创新方法,深入挖掘用户痛点及潜在诉求,全面洞察行业发展趋势及市场机会点; 3. 结合业务现状和需求,整合资源,推动和实现研究成果的落地应用; 4. 工作范围将根据个人经验、能力特长、意愿等进行划定侧重方向(消费者端、商家/物流端,行业/竞争研究),让每个人有可发挥的空间、有可提升的方向。

更新于 2025-06-05
logo of vivo
社招5年以上研发类

1、设计和实施AR/VR产品的算法架构,包括图像处理、深度学习、计算机视觉和实时渲染等方面; 2、研究和评估现有的算法解决方案,提出改进建议,并根据产品需求进行定制化开发; 3、与软件工程师合作,将算法解决方案整合到产品的技术架构中,并确保系统的稳定性和性能; 4、与产品经理和设计师合作,理解产品需求和用户体验,为产品提供优化的算法解决方案; 5、跟踪和评估AR/VR技术的发展趋势,保持对行业最新技术的了解,并应用到产品的算法架构中。

更新于 2024-06-19
logo of ctrip
社招5年以上住宿业务AI &

我们正在寻找一位具有AI智能化及内容算法经验的算法团队负责人。负责领导团队开发前沿技术,推动旅游领域知识的构建,支持内容产品的分发和AI Agent结合的创新应用探索,提升公司产品的智能化水平。 : 领导并管理内容算法团队,制定技术战略和发展方向,推动知识构建、知识编译、知识分发、探索LLM等创新NLP技术与Agent业务的结合。 1、负责基础NLP相关算法研发,面向但不限于:预训练,文本理解,同义词挖掘,实体识别,term权重分析,属性词挖掘 2、结合NLP和深度学习技术,推动领域知识的构建与优化,制定各环节Benchmark及衡量标准, 跟进业界先进大模型、多模态技术的应用及改进 3、发现并解决推荐分发场景中的意图识别、排序模型、相关性等方向的问题,召回策略和召回模型的优化,开发先进和高性能的召回算法 4、与产品、数据、工程等跨职能团队协作,推动技术落地和产品迭代。 5、负责团队成员的技术指导和能力提升,推动团队技术文化的建设。

更新于 2025-04-01