logo of antgroup

蚂蚁金服蚂蚁集团-大语言模型算法工程师-杭州/上海

社招全职3年以上技术类-算法地点:上海 | 杭州状态:招聘

任职要求


1、AI功底优秀,熟练掌握深度学习强化学习核心算法,熟悉Qwen、DeepSeek、Llama等流行大模型架构和技术细节。拥有大模型预训练、后训练、强化学习等相关研发经验的优先;
2、编程能力扎实,熟练使用PyTorch、Transformers、Megatron-LM、SGLang等主流框架,具备独立编写、调试完整算法与模型架构经验。在高影响力大模型开源项目中作出贡献的优先;
3、针对语言大模型的…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与构建蚂蚁百灵系列大模型,包括但不限于百灵后训练、强化学习系统的算法框架、语料合成、训推优化、模型调优等;
2、参与大语言模型后训练及专项能力优化,提升模型的数学推理、代码生成、超长上下文精细化理解、行动力(Multi-turn& Multi-step Function Calling) 等核心能力;
3、参与高效大语言模型架构优化,设计新颖Sparse Attention、Linear Attention等,提升大模型训练与推理效率。
包括英文材料
深度学习+
强化学习+
算法+
Llama+
大模型+
PyTorch+
还有更多 •••
相关职位

logo of xiaohongshu
社招3年以上机器学习平台

【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性

北京|上海|深圳
logo of antgroup
社招5年以上技术类-算法

蚂蚁国际ASAP技术部正在寻找有激情并且具有创新能力的算法工程师,通过使用AI技术,推动蚂蚁国际化业务的发展。蚂蚁是一家AI驱动的公司,国际化是蚂蚁当前的重点方向,在这个职位上,你有机会接触到互联网金融、人工智能、国际化这3个当前最热门领域。 1.基于跨境支付、跨境游、境外合作钱包等国际业务场景及特点,设计搜索、推荐及营销引流等算法模型及策略,提升用户体验和转化效果,帮助用户增长及商家成长。 2.全面了解蚂蚁国际业务发展,提供基于机器学习、深度学习、联邦学习、大模型、运筹优化等算法方案解决复杂的实际业务问题。

更新于 2025-10-10上海|杭州
logo of antgroup
社招4年以上技术类-数据

1、负责支付宝工程效能领域数据规划与建设,推进领域数字化、智能化的进程。 2、提供数据采集、计算、存储、产品化全链路数据解决方案,并参与方案建设。 3、负责领域数据架构治理工作,保障领域数仓健康有序发展。包括核心资产建设、数据质量保障等。

更新于 2025-08-31上海|杭州
logo of antgroup
社招3年以上技术类-算法

1.数据整理与分析:负责收集、整理股票证券分析领域的海量对话数据,对数据进行清洗、标注和分类,确保数据的准确性和可用性,为模型训练提供高质量的数据基础; 2.模型调优与评估 :基于现有大模型架构,针对股票金融分析对话场景,通过调整模型参数、优化训练策略等方式,提升模型对股票相关问题的理解和回答能力,确保输出的准确性和专业性;运用各种评估指标,如准确率、召回率、F1 值等,对模型效果进行客观评估,及时发现问题并提出改进方案; 3.对话策略制定 :深入理解股票业务知识和客户需求,结合模型特点,制定合理的对话策略,包括问题引导、答案推荐、情绪安抚等,使客服对话更加自然、流畅和高效,提升客户满意度;根据业务发展和市场变化,及时调整对话策略,确保模型能够适应不断变化的股票市场环境; 4.知识库建设与维护 :协助构建和维护股票证券知识库,将股票基础知识、交易规则、市场动态、常见问题解答等内容进行系统整理和更新,为模型提供丰富的知识支持,确保模型能够快速准确地回答客户问题;定期对知识库进行审核和优化,确保知识的准确性和时效性。

更新于 2025-11-04北京|上海|杭州