logo of aligenie

智能互联AI创新事业部-多模态大模型数据评测专家-未来生活实验室

社招全职3年以上技术类-综合地点:北京 | 杭州状态:招聘

任职要求


1、本科及以上学历,影视、编导、美学设计等相关专业优先;
2、具有2年及以上大模型项目经验,作为多模态大模型的深度用户,对文生图,文生视频大模型有丰富的实际操作经验,能提供对应的AIGC生图/生视频的作品优先;
3、有较好的美学…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


评测体系建设
深入理解公司 AI 产品业务场景,结合多模态大模型技术发展趋势,设计并持续完善模型评测体系,包括评测维度、指标定义、评测流程与方法论,确保评测结果能够客观反映模型能力变化与关键问题。

数据与评测标准建设
负责多模态大模型训练与评测数据的质量体系建设,包括数据标注规范制定、评测标准设计及数据集构建与优化,沉淀高质量数据资产,为模型训练与评测提供可靠基础。

模型评测与效果分析
联合产品与算法团队开展离线评测、场景评测及对比评测,系统分析模型表现与能力边界,输出结构化评测报告,支持模型迭代与产品优化。

评测场景与Benchmark构建
围绕核心业务场景构建评测任务与Benchmark体系,持续扩展评测覆盖范围,确保评测体系能够真实反映用户场景与模型能力。

数据驱动的优化闭环与行业对标
与算法、产品和数据团队协作,通过评测定位模型问题并推动数据补充与模型优化,建立“评测—分析—优化—复评”的迭代闭环,同时持续跟踪行业评测方法与Benchmark,优化内部评测框架。
包括英文材料
学历+
大模型+
AIGC+
还有更多 •••
相关职位

logo of tongyi
校招通义2026届秋

近年来,以大模型为核心的生成式人工智能技术在语言理解、内容生成、多模态建模与跨模态交互等领域取得了突破性进展,展现出前所未有的技术潜力与广泛的应用前景。 我们致力于通用人工智能(AGI)方向的前沿探索与产业落地创新。一方面,在迈向AGI的长期路径中,随着大语言模型能力的持续进化,多模态感知、融合与推理等关键问题日益凸显,成为构建通用智能系统的核心挑战;另一方面,围绕典型行业场景(如智能交互、高质量内容生成、跨模态检索与理解等),如何将现有大模型能力有效转化为可落地、可扩展、可持续的解决方案,也成为当前研究与工程实践的重点方向。 如果你对生成式AI、通用人工智能(AGI/ASI)前沿探索、多模态建模与智能交互系统有浓厚兴趣,并渴望深入参与下一代多模态通用模型的研发与演进,欢迎加入我们,共同定义未来AI的能力边界,牵引千行百业在智能时代的深度变革。 1. 多模态大模型算法创新:定义下一代多模态通用大模型技术范式,实现文本、语音、视觉模态的联合建模,探寻和解决多模态对齐、推理、Agentic等方面的核心挑战,不断追寻多模态通用大模型的效果上限。 2. 场景驱动的算法创新:结合业务场景(如智能交互、内容生成、跨模态检索等),设计并优化大模型架构,提升效果、效率与鲁棒性。 3. 端到端技术闭环:从数据构建、模型训练、评测到部署,主导技术方案落地,通过AB实验、调用量、用户反馈验证价值。 4. 前沿应用技术探索:紧跟并能驱动LLM、Diffusion Models、强化学习等技术相关进展,定义技术新范式,快速实验并迭代创新方案,拉升相关模型SOTA。

更新于 2026-05-26北京|杭州
logo of alibaba
社招1年以上

我们正在打造一款最懂电商的AI Agent智能应用,致力于通过大模型技术高效端到端解决电商商家问题(自动化竞品追踪、营销素材生成、运营数据分析等)。在这里,你将参与定义“什么是好的电商AI”,通过严谨的评测体系,让Agent从“能对话”进化为“能分析、能生成、能服务”。 ● 产品战略与规划:负责电商AI Agent产品的整体战略规划与路径图(Roadmap)设计。基于市场洞察、用户研究和商业目标,独立定义产品核心价值与迭代方向。 ● 产品方案设计:主导核心应用场景(营销内容生成、运营数据洞察等)的产品方案设计,撰写高质量的产品需求文档(PRD),协同设计和研发团队,确保产品方案兼具用户价值、商业可行性与技术前瞻性。 ● 模型能力与效果Owner:构建以业务效果为导向的模型及产品评测体系,定义关键评价指标(Metrics)。深度参与模型技术选型(如RAG、Fine-tuning、Agentic框架设计),持续跟进线上效果,驱动模型迭代与算法优化,为最终的业务结果负责。 ● 数据驱动与商业闭环:建立产品数据监控和分析体系,通过数据洞察用户行为和业务瓶颈。探索并实践产品的商业化路径,推动产品功能与业务增长目标的深度绑定,形成商业闭环。 ● 前沿探索与创新孵化:深度洞察行业及AIGC技术前沿动态(如Agent、多模态能力),探索大模型在电商全链路的创新应用机会,负责新场景、新模式的概念验证(POC)与孵化,为产品构建长期竞争壁垒。

更新于 2026-04-08杭州
logo of alibaba
实习阿里国际2026

阿里国际数字商业集团 -国际贸易事业部 Accio 团队 我们是阿里国际数字商业集团 - 国际贸易事业部 (ICBU)-Accio 团队。Accio 作为全球首个跨境领域的 AI 采购引擎,致力于让采购变得高效,让 B2B 外贸如零售般便捷。依托 25 年跨境采购经验、海量零售数据及专业分析,Accio 以 AI 搜索为核心,提供专业、高效、可信任的全球寻源找挑比价的服务。 岗位职责 1. 深度挖掘场景与用户需求,精准定位产品优化与创新方向,提升用户价值与产品竞争力。 2. 协同算法、开发、测试团队,精准把控产品进度,保障产品体验与项目按时推进。 3. 密切关注大模型技术与跨境电商动态,探索产品化及业务流程优化的落地机遇。 岗位要求 在这里,你将参与到LLM、多模态、Agent前沿技术的应用中,与之共同成长。发挥你的学习能力、创新思维、商业才能,亦或是对某个细分领域的深度理解,用新技术打造新体验、创造新市场。Accio 团队期待你的加入,一起推动业务迈向新高度!

更新于 2025-05-16杭州
logo of quark
社招3年以上技术类-算法

全面负责定义、设计并实现下一代对话系统的核心算法与交互范式,解决当前对话模型在多轮交互、知识应用、共情能力等方面的挑战,探索并引领模型在个性化、主动性、拟人化等前沿方向的技术突破。直接决定数亿夸克用户在Chat场景的与AI 的交互体验,塑造夸克在未来对话式 AI 时代的领先地位。 1. 对话体验定义与规划。深入分析用户意图与行为,结合业务场景,制定并执行对话体验的中长期技术演进路线图。并密切追踪并研究对话式 AI 领域的最新进展,包括主动式对话策略、多模态对话 (语音/视觉融合)、AI Agent 中的对话流控制等。您将主导定义“顶级对话体验”的标准,并将其分解为可落地、可量化的算法迭代目标。 2. 多轮对话与上下文理解。攻坚并解决长程、复杂多轮对话中的核心技术难题,包括但不限于指令遵循、上下文精准理解、长程记忆与遗忘机制、隐式意图识别等。您将设计创新的模型结构与训练策略,使模型具备真正连贯、有逻辑的对话能力。 3. 对话回复准确与全面。主导研发将外部知识 (如搜索、工具调用) 与大模型进行深度、动态融合的先进技术。致力于解决模型在对话中的意图偏离、事实性错误、内容不详实和知识更新不及时等问题,并通过 RAG 新范式或其他创新方法,显著提升对话的准确性与信息量。 4. 评测体系与数据飞轮。建立并完善一套科学、全面的对话能力评测体系,能够精准衡量模型的综合对话质量 (Coherence, Empathy, Informativeness 等)。设计并驱动高效的数据闭环系统,利用真实用户反馈持续、自动化地优化模型。

更新于 2026-06-05北京|杭州