阿里巴巴1688-大模型算法高级专家(AI搜索)-杭州
任职要求
1、人工智能、计算机等相关专业硕士及以上学历,有国际顶会论文发表、或知名开源项目有核心贡献的优先 2、有大模型,多模态,商品理解,个性化推荐,信息检索相关领域工作经验,对搜索/商品领域有深入研究者优先 3、自我驱动力,动手能力强,对AI行业有浓厚的兴趣,较强的学习能力和责任心 4、熟悉深度学习开源框架tensorflow、pytorch等,优秀的coding/工程能力
工作职责
1、负责AI搜索大模型算法整体工作。 2、负责大模型(含推理、多模态)及下游任务的训练及优化突破,包括但不限于:预训练、SFT、强化学习、混合专家等大模型核心训练技术 3、负责大模型在电商搜索和商品领域落地项目,涵盖用户个性化理解&意图识别,商品内容理解&结构化,行业知识库构建&知识标准化等任务 4、分析和解决大模型在领域应用中的技术难题并进行突破,并与业界先进技术进行持续对比 5、与产品和工程团队紧密合作,将先进的算法技术应用于实际产品开发,发挥算法在实际应用中的价值
主导通用AIAgent(对标Manus等前沿形态)的核心算法研发与技术落地,带领团队攻克大模型驱动下的信息搜集、智能决策、智能办公等关键技术难题,构建具备搜索增强、自然对话能力的新一代通用智能体,支撑业务在多领域的创新应用。 具体职责: 1.算法研发与创新:牵头通用AIAgent的核心算法设计,包括但不限于大模型微调与强化学习、智能规划与决策、多模态信息融合、搜索增强机制等,持续提升Agent的通用性与任务执行能力。 2.场景落地与优化:聚焦搜索、对话等核心应用场景,主导算法方案的落地实施,结合业务需求迭代优化模型效果,解决实际场景中的技术瓶颈(如上下文理解、意图识别、多轮交互连贯性等)。 3.团队管理与赋能:带领5-10人算法团队开展研发工作,制定技术研发计划,统筹项目进度,搭建高效协作机制;指导团队成员成长,提升团队整体技术水平与创新能力。 4.技术攻坚与前瞻布局:跟踪国内外通用Agent、大模型领域的前沿技术动态(如顶会论文、行业实 践),主导技术预研与攻关,推动技术成果转化,保障团队技术竞争力。 5.跨部门协作与国际化支持:与产品、业务等部门深度协作,明确技术需求与落地路径;若涉及海外业务,需主导适配海外场景的算法优化,提供国际化技术支持。
全面负责定义、设计并实现下一代对话系统的核心算法与交互范式,解决当前对话模型在多轮交互、知识应用、共情能力等方面的挑战,探索并引领模型在个性化、主动性、拟人化等前沿方向的技术突破。直接决定数亿夸克用户在Chat场景的与AI 的交互体验,塑造夸克在未来对话式 AI 时代的领先地位。 1. 对话体验定义与规划。深入分析用户意图与行为,结合业务场景,制定并执行对话体验的中长期技术演进路线图。并密切追踪并研究对话式 AI 领域的最新进展,包括主动式对话策略、多模态对话 (语音/视觉融合)、AI Agent 中的对话流控制等。您将主导定义“顶级对话体验”的标准,并将其分解为可落地、可量化的算法迭代目标。 2. 多轮对话与上下文理解。攻坚并解决长程、复杂多轮对话中的核心技术难题,包括但不限于指令遵循、上下文精准理解、长程记忆与遗忘机制、隐式意图识别等。您将设计创新的模型结构与训练策略,使模型具备真正连贯、有逻辑的对话能力。 3. 对话回复准确与全面。主导研发将外部知识 (如搜索、工具调用) 与大模型进行深度、动态融合的先进技术。致力于解决模型在对话中的意图偏离、事实性错误、内容不详实和知识更新不及时等问题,并通过 RAG 新范式或其他创新方法,显著提升对话的准确性与信息量。 4. 评测体系与数据飞轮。建立并完善一套科学、全面的对话能力评测体系,能够精准衡量模型的综合对话质量 (Coherence, Empathy, Informativeness 等)。设计并驱动高效的数据闭环系统,利用真实用户反馈持续、自动化地优化模型。
1. Lead并主导Agent产品全流程设计,规划功能架构与触发策略,定义产品核心价值; 2. 协同算法、工程团队,进行训练数据优化,优化模型训练数据,提升Agent任务处理能力; 3. 深入理解并推动机器评测效果提升,推动自动化评测,构建成体系的评测流程和产品,并逐步构建评测体系; 4. 负责Prompt设计、交互逻辑优化,打造流畅智能的用户体验; 5. 跨团队推动产品落地与迭代,通过数据驱动实现用户渗透目标;
AE 推荐算法团队负责AliExpress所有推荐类相关产品的算法研发,包括商品信息流、图文、短视频等众多场景的推荐,致力于用AI先进技术对商品&内容进行挖掘和理解,提升流量分发效率和用户体验,服务于全球243个国家数十亿消费者: 1. 负责跨境电商场景中的用户理解,利用超大规模深度学习对用户长短期兴趣进行建模与实时意图预测 2. 负责推荐商品召回,包括i2i召回、深度个性化召回、多兴趣表达与匹配等 3. 负责优化推荐排序大模型,利用大规模深度学习技术对商品进行表征&个性化排序 4. 负责推荐流量机制与策略研发,包括新品、新用户的投放策略与调控机制