蚂蚁金服研究型实习生-基于专家知识的多跳检索增强算法研究
任职要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位 -具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go -具有上述研究领域的…
工作职责
研究领域: 人工智能 项目简介: 在监管合规对话聊天场景中,需要针对用户给出的法规/态势/舆情等相关问题给出对应建议及观点,而用户问题涉及知识相对比较宽泛,依赖于多源数据(联网数据及内部知识库),且不同类型问题依赖检索逻辑不一。传统的RAG中通常通过改写步骤来保证问题的召回,在涉及专业领域知识时需要大量领域人员进行标注,耗费人力且效果不佳。
研究领域: 人工智能 项目简介: 在医疗领域,基于大模型的医学诊疗规划和决策一直面临着医学推理能力弱(医学事实性不足)、依据不足(可信性不足)、精准个性化不够(指导性不足,存在过度医疗的伦理风险)等问题。我们旨在结合先进的大推理模型、海量的医疗数据和专业医学专家的知识,依次完成以下研究和落地: 1. 研究大模型推理理论,建设一批高水平专家 AI 诊断推理智能体。 2. 研究复杂多智能体交互协同框架。 3. 落地面向下一代的自我进化的精准诊疗规划和可信医疗决策系统。
基于大模型(如通义千问)构建多因素(源库、目标库、源端网络、目标端网络、数据传输链路)根因分析与解决方案推建系统,并解决系统构建中的关键算法和技术,包括如下几方面: 1、设计合适的prompt,基于已有数据对模型finetune,并实现部署和线上应用; 2、构建知识库实现专家知识结构化,引入双向反馈通道,使能模型具备持续迭代能力; 3、与DTS工程团队一起上线系统,实现DTS线上异常任务自愈恢复。
职位描述 你将加入高德地图核心算法团队,在算法专家的指导下探索大模型(LLM/多模态)与推荐系统的深度结合。你将有机会接触亿级用户规模的真实业务场景,参与从前沿技术研究到工程落地的全过程。 你将参与或负责以下工作内容(包括但不限于): 1.用户兴趣预测:基于生成式大模型解析用户行为与商品/内容语义,构建⽤户需求预测模型,提升推荐场景的转化与⽤户体验; 2.端到端⽣成式链路:探索端到端生成式范式,替代传统多阶段漏斗链路流程,基于强化学习融合业务逻辑,建设出具备⾼效scaling能力的生成式算法新链路; 3.重排范式创新:借鉴生成式大模型技术构建生成式重排创新范式,通过Reward model + 强化学习实现端到端序列整体生态价值建模; 4.深入研究和理解大模型预训练、微调与强化学习技术,结合搜推业务目标持续优化模型效果。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动基础架构数据库团队,致力于构建认知型数据基础设施,持续定义数据技术的未来边界。团队基于全栈自研技术,打造了涵盖关系型数据库、NoSQL 数据库、大规模图平台、多模态搜索、云原生中间件等十余项产品的数据库矩阵,用独创的技术架构实现事务处理、混合查询、智能检索等全场景覆盖。我们不仅支撑集团核心业务,更通过火山引擎为客户提供具备企业级稳定性的数据库产品,助力客户以数据驱动实现业务增长。团队在大规模分布式架构、极致性能计算/存储引擎、软硬协同优化等领域具备顶尖技术积淀。面向 AI 时代,我们正在突破传统架构边界:一方面深化 AI 原生驱动内核、AI 算子优化等创新方向,推动数据库向智能 Copilot 演进;另一方面聚焦超大规模图计算、分布式跨模态数据联邦查询等前沿领域,构建支持跨模态数据管理的下一代设施。我们践行“务实浪漫”的极客文化,既在 VLDB 、SIGMOD 等顶级会议持续输出突破性成果,又以商业落地为导向打造全场景的产品矩阵。团队汇聚众多顶尖数据库专家和卓越工程师,分布在国内/海外多地。现诚邀具备数据库内核研发经验、分布式系统架构能力及 AI 创新视野的优秀人才,共同探索技术无人区,定义 AI 时代的数据基座,赋能全球企业实现 AI 驱动的业务变革。 1、参与字节跳动内部自研云原生数据库产品的设计和开发,打造业界领先的分布式OLTP/HTAP数据库产品; 2、参与字节跳动VeDB Family旗下数据库产品架构、功能迭代和服务化,研究云原生在数据库的应用技术并落地实现; 3、深入理解业务场景需求,针对性的为不同业务场景提供最合适的辅助工具,提高数据库产品的易用性、稳定性和运维能力。