蚂蚁金服蚂蚁国际-AI 创新人才-算法方向
任职要求
1. 国内外顶尖知名大学人工智能、计算机、自动化、数学等相关专业硕士或博士毕业; 2. 扎实的大模型相关经验与能力:熟悉生成式语言或多模态大模型的原理和底层代码,在大模型训练与优化上有实际经验,包括但不限于分布式训练、注意力机制优化,强化学习等;熟悉 Transformer 架构及其创新方向,具备独立设计和优化模型结构和训练能力; 3. 顶尖的学术研究背景,在机器学习、人工智能、数学、统计学等相关领域有深厚的理论基础;在顶会取得过学术成果,如自然语言处理领域ACL、EMNLP、NAACL等,计算机视觉领域如CVPR、I…
工作职责
我们正在寻找具有卓越算法能力和深厚科研背景的高级创新人才,加入我们的核心技术团队,专注于大模型领域的前沿技术研发。该职位开放给校招以及毕业三年以内的候选人。我们期待你,对于大模型技术充满热情,不仅算法扎实、动手能力强,更在大模型、人工智能领域有创新性想法,并希望你能够参与推动行业技术的突破。 1.大模型领域的算法研发与创新:负责生成式模型训练和推理相关技术的研究与优化;深入探索 Transformer 架构及其创新升级;针对大模型落地业务的应用场景,提出原创性技术解决方案,推动大模型技术在实际场景中取得领先性成果,形成行业竞争力; 2.前沿创新算法的落地与实现:紧跟业界算法相关创新,将学术研究转化为可应用于实际业务的问题解决方案; 3.跨团队协作与技术引领,与产品、工程、数据及交叉领域团队合作,推进大模型相关技术应用;
团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 课题介绍:多模态基础大模型VLM 是行业的研究热点,也是TikTok业务场景应用的关键技术,2024年TikTok AI创新中心研发了面向TikTok业务场景的多模态大模型VFM V1,在公开测试集上能够与最好的开源模型 Qwen VL持平,同时在 TikTok 业务测试集上,能够大幅领先所有其它基础模型。未来,我们希望持续研发具有高效感知和推理思考能力的基础模型,能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。 1、探索和研发大规模、多模态的基础模型(Foundational models),致力于构建能够统一理解和生成文本、视觉、代码等多模态信息,并具备通用智能的系统,力求达到或超越行业领先水平(如Gemini,Claude,GPT等); 2、深入研究多模态/代码预训练、指令微调、基于人类反馈的强化学习(RLHF)和其他对齐技术,以及模型压缩,以提升模型在复杂任务和跨领域泛化上的表现; 3、推动模型在多场景的落地应用,包括但不限于视频内容理解与生成、个性化推荐、代码效率优化、以及统一多模态交互系统等; 4、深入研究并与海内外一流大学的研究人员进行学术合作,共同探索AI的统一理论与前沿架构。
团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 课题介绍:多模态基础大模型VLM 是行业的研究热点,也是TikTok业务场景应用的关键技术,2024年TikTok AI创新中心研发了面向TikTok业务场景的多模态大模型VFM V1,在公开测试集上能够与最好的开源模型 Qwen VL持平,同时在 TikTok 业务测试集上,能够大幅领先所有其它基础模型。未来,我们希望持续研发具有高效感知和推理思考能力的基础模型,能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。 1、探索和研发大规模、多模态的基础模型(Foundational models),致力于构建能够统一理解和生成文本、视觉、代码等多模态信息,并具备通用智能的系统,力求达到或超越行业领先水平(如Gemini,Claude,GPT等); 2、深入研究多模态/代码预训练、指令微调、基于人类反馈的强化学习(RLHF)和其他对齐技术,以及模型压缩,以提升模型在复杂任务和跨领域泛化上的表现; 3、推动模型在多场景的落地应用,包括但不限于视频内容理解与生成、个性化推荐、代码效率优化、以及统一多模态交互系统等; 4、深入研究并与海内外一流大学的研究人员进行学术合作,共同探索AI的统一理论与前沿架构。
团队介绍:字节跳动基础架构数据库团队,致力于构建认知型数据基础设施,持续定义数据技术的未来边界。团队基于全栈自研技术,打造了涵盖关系型数据库、NoSQL 数据库、大规模图平台、多模态搜索、云原生中间件等十余项产品的数据库矩阵,用独创的技术架构实现事务处理、混合查询、智能检索等全场景覆盖。我们不仅支撑集团核心业务,更通过火山引擎为客户提供具备企业级稳定性的数据库产品,助力客户以数据驱动实现业务增长。团队在大规模分布式架构、极致性能计算/存储引擎、软硬协同优化等领域具备顶尖技术积淀。面向 AI 时代,我们正在突破传统架构边界:一方面深化 AI 原生驱动内核、AI 算子优化等创新方向,推动数据库向智能 Copilot 演进;另一方面聚焦超大规模图计算、分布式跨模态数据联邦查询等前沿领域,构建支持跨模态数据管理的下一代设施。我们践行“务实浪漫”的极客文化,既在 VLDB 、SIGMOD 等顶级会议持续输出突破性成果,又以商业落地为导向打造全场景的产品矩阵。团队汇聚众多顶尖数据库专家和卓越工程师,分布在国内/海外多地。现诚邀具备数据库内核研发经验、分布式系统架构能力及 AI 创新视野的优秀人才,共同探索技术无人区,定义 AI 时代的数据基座,赋能全球企业实现 AI 驱动的业务变革。 1、负责AI时代的数据库架构设计:涵盖支持AI/ML工作负载的新型数据库系统架构,优化AI模型训练与推理的数据访问效率;构建支持向量搜索、图计算、时序分析等AI场景的混合型数据库解决方案,探索LLM大模型与数据库系统的深度集成方案,如自然语言SQL生成、智能查询优化; 2、负责数据库智能策略研发:研发基于 AI 的数据库性能调优系统,包括自动索引推荐、查询计划优化、资源分配策略等;构建智能监控系统,实现异常检测、根因分析、容量预测等AIOps能力;开发自适应存储引擎,根据数据访问模式动态调整存储结构; 3、负责AI数据基础设施构建:构建AI数据基础设施,如支持特征工程、模型训练、推理服务的全流程数据管道架构,实现数据库与机器学习框架(TensorFlow/PyTorch)的高效对接; 4、负责AI与数据库结合的实践方案探索与落地:探索AI技术和数据库各产品结合的最佳实践方案并落地,服务超大规模的集团内部业务及火山引擎业务。
团队介绍:抖音内容理解团队负责抖音集团内容算法工作,业务覆盖抖音、今日头条、西瓜视频、剪映等业务,承接业务在内容理解、LLM应用、新业务方向探索等方向的工作。技术上涵盖了CV,NLP,音频,LLM等算法方向。团队承载业务需求同时还负责底层基础算法技术,推动如基础预训练模型、视频生成等学术和专利相关工作,负责为抖音各个技术方向提供长期有深度的技术支撑。得益于抖音集团业务数量庞大的多模态业务数据和业务需求,团队能够有资源和机会去做出行业领先的技术创新,用最新的技术去改变影响用户和改变行业格局。 1、课题背景:随着多模态大模型效果的提升,现已变成了多个业务和技术方向的核心算法能力。随着业务在内容理解、推荐系统、内容治理、客服、创新业务等方向的广泛应用,对于多模态大模型也带来了新的算法能力需求:(1)内容理解:团队涉及了包括视频、直播、评论、图文等等不同的内容体裁和业务形态,集团公司所覆盖的活跃用户每天会产生数量巨大品类丰富的多模态内容,在提供了独一无二内容数据的同时,也衍生出来了独特的业务和技术需求;(2)多模态对话能力:作为大模型技术最直接的应用场景对话场景,团队在客服、AI分身等领域快速推进相关技术的落地应用。对应方向的多模态内容理解和挖掘、多模态对话能力是支撑该场景的重要基础技术,需要建设作者profile抽取、业务多模态文档挖掘、多模态对话模型等技术建设;(3)业务和技术创新:MLLM技术对于包括推荐、内容理解、社交等业务方向和算法技术都造成了巨大的冲击,多模态模型技术作为核心技术正在重构每一个重要的方向,会在下一代推荐系统、新业务形态、内部流程架构重构上扮演关键角色。 2、课题挑战:(1)高标准的算法要求:推荐系统、内容治理等方向内容理解的复杂度远高于公开评测集,团队需要在海量内容的业务真实场景下探索高效率、高标准的多模态算法解法,帮助团队迭代新一代的推荐系统、内容理解系统;(2)复杂的多模态生态交互:内容作者、内容消费者、社交交互、评论交互等不同角色在平台形成复杂的多模态交互,由此衍生出新的内容交互语义、生态互动逻辑,对多模态大模型算法提出了独特的算法挑战;(3)业务创新:大模型在多个领域都展现出来了卓越的理解和交互能力,如何应用新技术创造出新的业务方向,如何公司内部用新技术替代掉老的系统和流程,要求算法团队在有足够扎实技术能力的同时对业务和技术有足够深入的思考。 3、研究方向:大语言模型、多模态大模型、内容理解、推荐系统。