logo of antgroup

蚂蚁金服研究型实习生-基于国际化金融场景的大模型应用能力

实习兼职研究型实习生地点:北京 | 上海 | 杭州状态:招聘

任职要求


研究领域:
-目前正在攻读计算机科学或相关STEM领域的硕士或博士学位
-具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScriptGo
-具有上述研究领域的相…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


研究领域:
  人工智能
项目简介:
  在大模型的国际化应用落地过程中,要解决几个核心的问题:
1. 大模型对于小语种的支持:在蚂蚁国际化场景中,既有中英文这样的大规模使用的语言,也有东南亚,欧洲,非洲等各的确相对较小语种的实际需求,这些小语种的语料相对而言获取难度高,也导致了大模型在应用落地过程中会遇到许多困难,探索一条高效可行的道路来扩充大模型对于小语种的支持是在业务和技术上都有着突破意义的工作
2. 大模型对于体验的支持:在模型的使用过程中,探索更好的用户体验需要进行相当的投入来保持对于体验的关注和不断尝试,既包括通过推理模型来提升模型回复能力,也包括通过长思考能力来提升问题解决的思路完备性,也可以借助于大模型的代码生成等推理能力来生成交互式界面,或者通过多模态模型来进行包括视频在内的AIGC等,在应用过程中有很多细节需要结合大模型基座进行优化
3. 模型可信:在金融场景中,模型回复的准确性和安全性至关重要,结合业务场景进行探索模型的grounding,知识注入和幻觉消除等工作
包括英文材料
学历+
Java+
还有更多 •••
相关职位

logo of antgroup
实习研究型实习生

研究领域: 自然语言处理 项目简介: 蚂蚁知识图谱平台经过多年金融领域业务的支撑,沉淀了基于属性图的语义框架——语义增强可编程框架 (Semantic-enhanced Programmable Graph, SPG)。它创造性地融合了 LPG 结构性与 RDF 语义性,既克服了 RDF/OWL 语义复杂无法工业落地的问题,又充分继承了 LPG 结构简单与大数据体系兼容的优势。基于SPG的图谱推理(SPG Reasoning)利用谓词语义和逻辑规则来定义知识之间的依赖和传递,并提供可编程的符号化表示,以方便机器理解,实现专家规则和模型的融合推理。本项目旨在对基于SPG的知识图谱存储及推理技术进行研究,包括但不限于符号推理与GNN模型融合、大模型+KG结合、大规模图存储和图匹配计算优化、图学习和深度学习训练和推理等技术研究,以及在工业场景的实用化。

北京|杭州
logo of alibaba
实习淘天集团研究型实

阿里妈妈-智能广告平台团队负责阿里妈妈核心广告产品的广告主投放效果优化、广告产技能力创新和客户增长。我们通过挖掘广告主多元需求,升级智能投放能力提升投放效果,带动广告预算增长。技术上,我们通过基于大模型、生成算法、强化学习的出价Agent对智能出价系统进行深度优化。 我们在智能出价领域有丰厚的技术底蕴,在NeurIPS、KDD、WWW等国际高水平会议上发表学术论文,并通过技术创新显著提升业务效果。决策智能技术是人工智能的关键研究领域,在大型博弈环境中有广泛应用,例如在线广告、金融市场、电子商务和能源交易。在线广告是典型的大型博弈场景,随着生成算法在广告决策领域的初步成功应用,我们相信决策领域的大模型蕴藏着巨大潜力和广阔的技术探索空间。 具体职责: 1. 深入运用生成算法(如Diffusion、Transformer等)对出价决策模型进行探索与迭代。 2. 探索大模型(LLM)与出价决策模型的融合方案,包括但不限于特征增强、环境建模、端到端决策等。 3. 跟进业界前沿技术趋势,开展前沿算法的研究工作,撰写发表论文。结合实际业务需求,将技术应用到实际业务场景。 加入我们,您将获得: 1. 贴近工业实践的技术挑战,享有丰富的数据资源和强大的计算支持。 2. 深度参与研发团队内部研讨,与顶尖专家共同探讨前沿技术,合作发表国际顶级会议论文。 3. 一对一的行业专家指导,助力业界领先并具有巨大影响力的工作。 4. 可观的实习薪酬以及校招人才计划的绿色通道。

更新于 2025-08-11北京
logo of xiaohongshu
社招3年以上机器学习平台

【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。

上海
logo of xiaohongshu
社招引擎

大模型具备很强的泛化及理解世界能力,在小红书内的众多生产场景遍地开花,大模型的训练和部署已成为许多算法工程师的日常。在多团队、多业务频繁使用的大规模GPU集群上,如何能够通过高效的GPU调度策略,使大家不仅能丝滑地完成训练及部署任务,同时也能充分激发大规模GPU集群的效能,是行业公认的关键挑战。在这里,你可以聚焦LLM场景,接触到超大规模GPU集群,并使用真实负载数据进行深入分析及技术探索。欢迎加入我们,一起探索领先技术改变世界! 工作职责: 1、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、集群调度、GPU虚拟化、故障快速恢复、存储&网络加速等手段,提升大规模GPU集群的整体使用效率。 2、负责构建面向大模型训练、微调、推理、部署全流程LLMOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地。 3、持续关注业界最新的GPU资源调度相关技术动态,探索建设业界领先的资源调度策略及方法,构建下一代大规模AI资源调度系统。

北京|上海