蚂蚁金服【蚂蚁星】算法工程师-大语言模型-蚂蚁国际
任职要求
1.计算机、人工智能、统计学、数学、信息或相关专业的博士生,特别优秀的硕士生亦可。作为重要角色参与领域内有含金量的数学/计算机/AI竞赛并取得成绩(比如ACM)优先; 2.熟练掌握机器学习、自然语言处理、大语言模型等相关领域的基本理论和算法,有在 CVPR/ICCV/ECCV/NeurIPS/ICML/ICLR/TPAMI/ICJV 等国际顶会顶刊发表论文经验者优先; 3.具备LLM多模态科研背景,具有NLP或垂直行业大模型Pre-train、Finetune、Inference等优化经验优先; 4.扎实的算法工程能力,熟练掌握Python、TensorFlow、PyTorch等有大规模数据处理、大规模分布式训练等工程经验优先; 5.具有良好的表达能力,和团队合作能力,具有熟练的中英文沟通能力优先。
工作职责
蚂蚁国际全球技术AI智能部正在寻找有激情并且具有创新能力的算法专家,通过使用AI 特别是生成式人工智能技术,推动蚂蚁国际化业务的发展。蚂蚁集团是一家AI驱动的公司,国际化是蚂蚁集团的重点方向,在这个职位上,你有机会接触到互联网金融,人工智能,国际化这3个当前最热门领域。 国际AI智能部负责大模型算法的创新应用与落地,同时也负责蚂蚁国际的 AI 基础设施和应用平台的建设。我们正在寻找热爱大模型的优秀人才加入我们。 其中,金融 AI 与大模型应用平台团队负责蚂蚁国际的金融 AI 业务,如基于大模型的金融助理在海外钱包的落地,以及蚂蚁国际的 AI 平台与基础设施建设,通过更加高效的训练和推理能力,以及结合 Agent 的平台研发助力蚂蚁国际全面拥抱生成式人工智能达成 AI 为先的战略。 1.负责大模型技术前沿技术跟踪、创新和落地。负责文本以及多模态大模型算法研发,对图片语音文本进行跨模型理解和生成。通过大模型算法创新和优化,致力提升大模型算法的场景落地和业务增效; 2.负责研发知识增强大语言模型技术,包括大模型领域适配、知识对齐、知识增强等,深入挖掘垂直行业、开源以及蚂蚁的海量数据,构建行业知识库,以支持相关技术的蚂蚁国际各个业务中的持续创新和实践应用; 3.负责垂直领域大模型算法开发,通过持续预训练和多任务模型微调,提升垂直大模型的核心技术价值和平台化落地; 4.深度参与产品研发项目,与团队成员合作,共同推动人工智能技术在实际业务中的应用和落地; 5.深入跟踪调研大语言模型以及相关方向(包括但不限于LLM/多模态等)的前沿技术,并适时进行技术分享。推动相关领域技术创新,进行专利申请和学术文章发表。
1、深入探索LLM在搜索场景中的推理能力与深度研究(Deep Research)模式,优化信息整合与总结效果,打造高效、精准的智能搜索产品,推动AI技术在实际应用中的突破; 2、AI搜索总结Agent研发: 1)设计并实现基于LLM的搜索总结Agent,提升搜索结果的理解、推理与结构化总结能力; 2)探索LLM Reasoning技术(如思维链、多步推理),优化复杂查询的Deep Research模式,实现长文本理解与跨文档信息融合; 3)构建端到端系统,涵盖意图识别、知识检索、结果生成与偏好对齐,提升用户体验; 3、模型优化及应用: 1)通过指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术优化模型在搜索场景的适应性; 2)探索多模态信息(文本、代码、结构化数据)融合的搜索与生成技术; 3)研究未来生活中的创新应用场景(如个性化知识助手、自动化研究工具),探索技术边界。
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、团队负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式;主要工作方向包括: 1)优化&创新RLHF算法训练效率与模型泛化能力; 2)Long CoT技术的实现和应用; 3)多模态大模型(文本、图像、语音)的Posttraining算法; 4)构建高质量、多领域的数据合成方法; 5)探索LLM在情感对话、创作等场景的应用。
1、负责AI小快智能助理机器人的研究和开发; 2、优化基础模型,并采用RAG、Agent等大模型衍生框架,来提升相关业务指标; 3、持续跟进并深入调研大模型前沿技术、开源方案,跟踪业内大模型领域的最新进展并推进相关研究,探寻将最新技术应用到AI小快的可能性。