蚂蚁金服【转正实习】大模型智能体优化算法
任职要求
基础条件 1.计算机、数学、统计学等相关专业优先; 2.有顶会论文(ACL/ EMNLP/ ICLR/ NeurIPS/ ICML / CVPR/ ICCV/ ECCV等)/高影响项目/开源贡献者加分。 专业能力 1.模型理解与优化:深入理解Transformer和主流LLM模型架构演进原理,对后训练算法有实操经验和深刻认知,拥有Agentic RL训练实操经验者优先; 2.Agent 与系统编排:能做任务拆解与多Agent协作;熟悉RAG、Memory、Tool-Use(含MCP/类协议/Skills等)并能工程化落地;独立开发过具备一定影响力AI应用者优先; 3.数据构建:具备Data-centric AI意识,精通后训练所需高质量数据挖掘与构造,具备合成数据(Synthetic Data)与动作轨迹(Trajectory)构建实践经验者优先; 4.评测与交付:能搭建评估闭环(autorater/LLM-as-judge、离线评测、A/B)…
工作职责
将大模型能力做成可上线、可迭代、可控成本的产品能力。通过打造数据飞轮、模型适配与后训练、评测与实验等关键手段,实现端到端的闭环交付,持续提升产品的效果与稳定性。 具体职责包括以下相关方向的一项或多项:包括语言大模型(LLM)应用后训练与智能体优化、多模态大模型(VLM/MLLM)应用后训练与智能体优化,以及图像、视频、语音、文档等场景下的 AIGC 能力构建与生成效果优化。 需求与问题定义 深入业务与产品共创需求,深入业务与产品共创需求,将文本、图像、视频、语音、文档等场景诉求转化为可执行的 AI 任务定义,明确目标、边界、优先级与验收口径。 方案与应用架构 在Prompt、RAG、微调、Agent等路线间做技术选型与权衡,设计端到端应用架构(含上下文、工具调用、记忆、权限与安全),并完成RAG、Multimodal RAGMemory、Tool Use、多Agent等能力的工程化落地与生产级集成。 数据飞轮与治理 搭建高效的数据采集、清洗与标注工程流水线。前瞻性地探索合成数据与模型自标注等自循环策略,同时建立完善的数据版本追踪与质量评估体系,真正打通“模型训练-业务应用-用户反馈-数据迭代”的增强回路。 模型适配与后训练 主导基座大模型向顶尖垂直行业专家的后训练的全链路技术演进,包括高质量的SFT、RL阶段PPO、GRPO等前沿强化学习与偏好优化算法攻坚,全面突破模型在复杂业务场景下的指令遵循精度、极致可控性与长链路逻辑推理天花板,显著提升大模型在复杂业务场景下应用能力。 评测体系与实验 面向业务目标设计评测指标与Rubric,搭建自动化评测框架(含人工评审),建立离线基准与线上实验体系(A/B、Bandit),持续监控指标漂移与策略投机以防止效果退化。 生产交付与运营 负责系统集成与上线发布,对线上质量、稳定性与成本负责,建立监控、告警、兜底与人工接管机制,推动持续迭代。
1.研究大模型智能体和对话技术的基础核心能力,包括推理、规划、复杂指令遵循、知识注入、偏好对齐、拟人沟通等核心能力; 2.基于大模型,研发语音/对话交互场景各类智能体应用,支持智能客服、语音智能分析等项目,提升美团服务能力和效率; 3.深入理解智能体和对话交互相关业务场景,进行重点难点技术攻关工作,将技术优化与业务场景联系起来,快速解决业务痛点问题; 4.不断探索技术新领域,持续推动技术能力的沉淀和技术氛围的建设。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:团队负责公司多个跨产品业务方向,提供可复用的平台能力及技术解决方案。我们为公司多业务提供如地理位置、行业数据、舆情、众包标注、中间件等多类型的中台能力与技术解决方案,积极利用AI等技术做中台能力提效与升级。加入我们,你将有机会从中台的多视角参与业务建设,感受不同类型/阶段的业务特点;通过投身亿级用户场景的开发&架构工作,学习和解决极富挑战的技术问题;你也可以从数据出发,积极利用策略和模型,为业务提供有价值的助力。 1、研究、创新、开发和优化最先进的大模型算法和智能体技术,如大模型数据合成、大模型后训练技术、多模态大模型、自主规划智能体、检索增强等; 2、精益求精,结合最新的深度学习框架,如TensorFlow、PyTorch等,不断优化和改进现有的大模型和智能体技术,通过Data Driven的方法不断提高模型的准确性和性能,达到最优状态; 3、研究和开发大模型应用技术,并落地字节跳动各业务场景; 4、跟进前沿的大模型和智能体技术,保持技术的领先。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和工具开放给外部企业,提供云基础、视频与内容分发、大数据、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。 1、协助大模型应用开发:在资深工程师的指导下,参与大模型相关应用的开发工作,如知识助手等,负责应用的调试与优化; 2、数据处理与分析:协助进行模型训练数据的收集、整理、标注工作,并对数据进行分析,提升应用的准确性; 3、问题排查与解决:在应用开发过程中,及时发现并记录遇到的技术问题,对于无法解决的问题,及时上报,协助定位和修复问题; 4、智能体搭建:参与AI Agent项目交付工作,包括智能体设计、搭建以及调优、工作流建设。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:国际商业化产品与技术团队支持字节跳动国际产品的广告产品与变现技术。我们负责end2end的大型广告系统建设,为客户提供商业推广方式与方案。我们的团队遍布北京、上海、美国、新加坡等地,在这里你将有机会开阔自己的国际化视野,接触到全球领先的商业产品架构、模型和算法,并有机会参与并推动互联网广告行业的创新和变革。 1、负责Foundation model和Generative AI的基础能力建设,追踪业界文本生成/翻译、图生文、Deepfake等方向的最新技术,极致优化预训练、微调、领域知识注入、RLHF、RM、AI Safety等能力; 2、将AIGC相关技术在广告、电商、短视频、直播等商业产品的内容理解上落地,构建新一代基于大模型的商业化生态; 3、从事强化学习与大语言模型智能体(LLM-based Agent)相结合的交叉研究与应用落地; 4、探索大模型高效训练/推理方案。