logo of quark

夸克智能信息-多模态理解算法专家-杭州/北京

社招全职1年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1、计算机科学、人工智能、机器学习或相关领域的硕士或博士学位;
2、在多模态、计算机视觉NLP、AIGC、计算机图形学、机器学习等一个或多个领域有较深入的研究;
3、具有出色的分析、解决问题的能力,能深入解决大模型训练、应用存在的问题,有自主探索解决方案的能力者;
4、能够积极创新, 乐于面对挑战, 负责敬业,优秀的团队合作精神,一起探索新技术,推进技术进步。
加分项:
1、具有优秀的基础算法、扎实的…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 探索研究多模态理解、计算机视觉、自然语言处理等前沿技术;
2. 参与研发多模态、全模态大模型等下一代人工智能核心技术,探索大规模/超大规模多模态理解与生成统一的基础模型,提升大模型能力;
3. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。
包括英文材料
机器学习+
学历+
OpenCV+
NLP+
大模型+
算法+
还有更多 •••
相关职位

logo of antgroup
校招蚂蚁星计划 -

机器智能部门介绍: 蚂蚁集团大安全事业群机器智能团队致力于打造安全科技的核心竞争力,做可信AI的持续引领者,为广大支付宝用户的数字化生活提供全方位安全保障。作为蚂蚁集团安全版图中的核心力量,我们正以最前沿的AI算法为刃、以大模型为盾,编织数字世界的"安全之网"。在这里,大模型、智能体、AI安全等热门的研究不再是纸上谈兵,每一个方向都在落地成为真实业务场景、十亿级用户的智慧防线。 关于团队,过去获得过浙江省科技进步一等奖、中国电子学会科技进步一等奖,人工智能学会吴文俊人工智能自然科学奖一等奖,中国图象图形学学会科技进步一等奖、多次获得中国计算机学会科技进步奖、世界人工智能大会SAIL之星与"镇馆之宝",等多个重量级奖项。可信AI专利布局全球第一,主导制定ITU国际风控标准。多名Kaggle Grandmaster ,拿过多个KDD Cup/CVPR/NeurIPS/ICCV/CVPR/ECCV等多个顶会竞赛冠军,累计发表近百篇顶会论文; 在这里,你将有机会和毕业于海内外著名高校的行业专家们、众多KDD Cup/CVPR 等比赛冠军、Kaggle Grandmaster 、顶会论文作者们共同根植蚂蚁丰富的场景数据,利用海量算力探索创新前沿算法应用,使用领先的机器学习算法解决风控业务问题,构建数据与知识驱动的智能风控体系,提升用户的支付安全体验。 加入我们,让我们一起为世界带来微小而美好的改变。 1.伪造检测方向,统一篡改和生成,统一图像、音频和视频的Allinone模型,并探索推理和生成reward; 2.多模推理方向,视觉图像&视频reasoning,提升理解和推理能力,攻坚reward设计、多模态推理框架设计等核心问题; 3.多模交互方向,构建统一的端到端多模态模型,使其能够像人类一样同时感知多种模态的信息(文本、图像、音频、视频),并以流式方式生成文本和自然语音响应。

北京|上海|杭州
logo of bytedance
实习A222718

团队介绍:Data-电商-智能对话团队,致力于打造业界领先的大模型对话系统。团队服务的日活用户超过数亿,应用场景覆盖抖音电商全链路,包括平台客服、平台商服、商家客服、达人客服,以及创新的智能导购等核心业务场景,通过持续的技术创新和优化,成功构建了一套完整的智能对话解决方案,为电商业务带来了显著的效率提升和用户体验改善。 课题介绍: 背景:电商智能客服正逐渐成为业务增长和用户体验优化的重要方向,基于大型语言模型(LLM)的智能客服系统解决电商场景中的核心挑战,由LLM完成一次用户进线的完整接待过程,包括诉求澄清、方案协商、方案执行等阶段,实现电商业务的智能化升级——让用户享受更智能高效的客服服务。 研究方向:本课题聚焦于LLM 后训练与智能客服。构建基于 LLM 的多智能体(Multi-Agent)框架,通过规划、回复、工具三类Agent的协作,实现从问题分析、方案执行到结果反馈的全流程智能客服。核心目标是确保客服对话的准确性、合规性与流畅度,避免模型生成幻觉或违背平台政策。同时,围绕电商客服的复杂任务,构建 Benchmark数据集,优化SOP遵循、多轮交互、用户满意度等指标。此外,研究高效数据利用方法,探索低标注数据条件下的LLM训练,并开发自动生成高质量训练数据的系统,以降低人工标注成本,提高智能客服的服务质量与效率。 1、数据挖掘:负责数据集的构建与维护,利用数据飞轮机制不断优化数据质量和丰富度,进行深度的数据挖掘,沉淀高价值信息; 2、大模型训练:针对业务需求进行大模型的继续训练(CT)、有监督微调(SFT)、偏好学习,以及多模态模型训练,提升模型在特定场景下的表现; 3、提示词工程:与业务专家合作,构建和优化结构化的提示词,充分挖掘和利用大模型的能力,高效、精准解决实际问题; 4、信息检索:开发和优化Query理解、召回、相关性排序等技术,提升信息检索的效率和准确性,提升RAG的效果; 5、智能体技术:利用领先的智能体框架,增强大模型的推理、对话和反思能力,解决复杂业务问题,提升用户体验; 6、大模型评测:制定和实施大模型的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性; 7、应用落地:定义业务问题,设定任务标准和目标,不断优化模型和系统,以达到最佳的业务效果和用户满意度。

更新于 2025-03-04上海
logo of tongyi
社招2年以上技术类-算法

我们是阿里巴巴通义实验室AI搜索算法团队,专注于下一代AI驱动搜索技术的前沿研究与产业化落地。团队在文本搜索、多模态检索、大模型驱动的搜索范式等方向持续创新,负责通义实验室AI搜索领域的核心技术研发和产品落地。 团队此前开源的GTE/GME/Qwen3-Embedding系列表征与重排模型累计下载量突破1亿次,是开源社区最受欢迎的检索模型之一。欢迎加入我们,共同探索AI搜索的未来,创造对社区和产业具有深远价值的技术突破。 工作职责: 1. 负责搜索、RAG核心模块的算法创新与优化,涵盖文本/多模态Query理解、Embedding表征学习、ReRank重排序模型等,确保技术效果保持行业领先水平。 2. 针对问答系统、智能客服、多模态Memory等实际应用场景,优化搜索/RAG/AI Agent端到端框架,全面提升系统的准确性、执行效率和可扩展性。 3. 与产品、工程团队深度协作,推动核心模型的开源发布和业务应用落地,支撑关键项目的高质量交付。

更新于 2025-11-05北京|杭州
logo of quark
社招3年以上技术类-算法

全面负责定义、设计并实现下一代对话系统的核心算法与交互范式,解决当前对话模型在多轮交互、知识应用、共情能力等方面的挑战,探索并引领模型在个性化、主动性、拟人化等前沿方向的技术突破。直接决定数亿夸克用户在Chat场景的与AI 的交互体验,塑造夸克在未来对话式 AI 时代的领先地位。 1. 对话体验定义与规划。深入分析用户意图与行为,结合业务场景,制定并执行对话体验的中长期技术演进路线图。并密切追踪并研究对话式 AI 领域的最新进展,包括主动式对话策略、多模态对话 (语音/视觉融合)、AI Agent 中的对话流控制等。您将主导定义“顶级对话体验”的标准,并将其分解为可落地、可量化的算法迭代目标。 2. 多轮对话与上下文理解。攻坚并解决长程、复杂多轮对话中的核心技术难题,包括但不限于指令遵循、上下文精准理解、长程记忆与遗忘机制、隐式意图识别等。您将设计创新的模型结构与训练策略,使模型具备真正连贯、有逻辑的对话能力。 3. 对话回复准确与全面。主导研发将外部知识 (如搜索、工具调用) 与大模型进行深度、动态融合的先进技术。致力于解决模型在对话中的意图偏离、事实性错误、内容不详实和知识更新不及时等问题,并通过 RAG 新范式或其他创新方法,显著提升对话的准确性与信息量。 4. 评测体系与数据飞轮。建立并完善一套科学、全面的对话能力评测体系,能够精准衡量模型的综合对话质量 (Coherence, Empathy, Informativeness 等)。设计并驱动高效的数据闭环系统,利用真实用户反馈持续、自动化地优化模型。

更新于 2025-12-08北京|杭州