阿里巴巴LLM大模型应用算法实习生

实习兼职淘天集团研究型实习生2026-01-12地点：杭州状态：招聘

扫码手机上打开

任职要求

1. Agent方向：深入理解Transformer架构、掌握预训练（Pretrain）、监督微调（SFT）等基础算法，并深入应用 RLHF、RLAIF、DPO/GRPO 等对齐技术；
2. LLM方向：熟悉常见LLM模型，理解LLM的原理和架构，扎实的机器学习/深度学习基础，熟练掌握深度学习框架，如PyTorch等，并…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. Agent方向：直接参与到导购Agent的算法研发工作，包含无障碍导购Agent、搜索导购Agent两个Agent项目并结合技术创新与实际业务落地，产出高质量论文、专利与开源成果。包括相关项目的高质量数据构建，支撑复杂任务建模与行为学习，运用大模型SFT、RL等Post-training训练方法并探索 Online RL 等前沿方法，设计并落地“过程监督 + 结果监督”联合训练范式，融合MCTS、ToT、Reflection等推理方法，等等；
2. LLM应用方向：探索基于LLM的Query理解大模型，通过天猫的数据微调大模型生成ID表征向量，在搜索和推荐算法各模块进行深度的探索和应用。包括但不限于语义相关性、类目预测、召回排序等。探索生成式搜索技术（如Query扩展、结果摘要生成），助力搜索从“信息呈现”向“决策辅助”升级；
3. 结合业务需求，设计和扩展LLM的应用场景范围及规模，提高模型微调后再垂直领域的应用及专家模式的架构尝试；
4. 跟踪LLM与Agent领域的国际前沿技术动态，开展前沿算法的研究工作，推动技术创新在业务场景中的落地应用，重点突破复杂推理、GUI Agent、AI搜索等方向的技术沉淀和业务创新。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

机器学习+

信息检索+

NLP+

大模型+

AI agent+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

大模型应用算法实习生（Agent方向）

实习D13917

1、了解大语言模型及多模态大模型的微调、prompts调优、指令构建与优化，负责将LLM落地在AIGC产品上； 2、负责LLM及多模态大模型的应用相关技术研究，包括但不限于Agents 、RAG、 MCP、prompt工程等，探索大模型应用前沿及新兴应用场景； 3、负责agents相关基础组件的建设，如上下文记忆、deep research、workflow 等，并针对业务需要研发相关的工具集合； 4、了解业务，与公司各技术团队密切配合，能与产品、运营等角色高效沟通需求和目标，发挥自己的主观能动性，设计技术解决方案。

更新于 2025-07-16北京

大模型应用算法实习生

实习D13918

1、负责基于LLM及多模态大模型的应用创新研发，并在真实场景实现落地，创造收益增长； 2、负责LLM应用中台及相关技术创新研发，包括但不限于Agents 、RAG、 function call、system prompts等。

更新于 2025-07-16北京

大模型应用算法实习生-快意

实习D13919

1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术，将大模型的生成、理解、交互能力在公司核心业务场景应用落地，包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等； 2、负责LLM及多模态大模型的应用中台及相关技术模块搭建，包括但不限于Agents 、RAG、 function call、system prompts等，探索大模型应用前沿及新兴应用场景； 3、跟踪行业及大模型技术发展，结合业界前沿技术和业务需求，打造大模型应用的最佳实践； 4、了解业务，与公司各技术团队密切配合，能与产品、运营等角色高效沟通需求和目标，发挥自己的主观能动性，设计技术解决方案，培养自己的良好的业务sense和综合素质。

更新于 2025-07-04北京

大模型应用算法实习生-AI Coding-筋斗云人才计划

实习A69475

团队介绍：AI Coding团队致力于探索LLM在软件开发全生命周期的应用，支持MarsCode、Trae等代码智能产品中代码补全、智能编辑、程序debug以及代码修复等核心AI功能的全链路模型优化。欢迎对大模型、Agent技术和开发者工具体系感兴趣、对技术有追求的同学加入，共同成长！课题介绍：一、课题背景与研究动机 1、复杂软件工程项目的挑战与需求：随着企业业务需求的快速增长，软件项目规模持续扩大，系统架构日趋复杂，跨语言、多框架、多平台开发成为常态。开发团队在应对代码理解、跨模块协作、版本演化和长期维护等问题时，效率与质量面临双重挑战； 2、大模型在编程领域的潜力与不足：大规模语言模型在代码生成、补全和文档生成等任务上已展现强大能力，推动了智能化开发工具的初步落地。然而，在应对复杂软件工程项目时，现有模型在长序列建模、上下文一致性、跨文件依赖理解及代码质量保障方面仍有明显不足； 3、技术与产业机遇：1）范式变革：大模型有望成为软件开发全流程的重要参与者，推动从工具辅助向智能协作转变，覆盖从需求分析到代码实现、测试生成和自动化重构的各个环节；2）行业转型：通过深度优化大模型在复杂软件开发中的能力，可显著提升企业研发效率、软件质量与团队协作能力，助力数字化转型；二、研究目标与创新价值 1、研究目标 1）提升大模型对复杂项目的语义理解与跨模块上下文建模能力，尤其是在长序列代码、跨文件依赖和复杂逻辑推理场景中的表现； 2）优化模型微调与自适应学习策略，通过引入多任务学习、强化学习（RL）和领域知识增强，构建具有高泛化能力和行业适配能力的大模型； 3）集成领域知识库与检索增强（RAG）技术，确保模型生成结果在行业标准、安全规范和合规性方面的准确性与可靠性； 4）构建自我进化的 AI Coding多智能体系统，基于强化学习、长期记忆、垂类模型训练、测试时计算等方法，持续优化任务规划、代码生成等能力，实现数据驱动的自我进化，从而实现复杂应用的端到端全栈开发； 2、创新价值 1）模型结构与预训练策略的突破：在通用预训练模型基础上，结合程序分析与语法语义建模，提升对大型软件项目的理解能力，尤其是在模块间交互和函数调用路径分析方面； 2）模型优化与自适应增强：通过多维度监督信号（代码质量、运行性能、测试覆盖率等），实现强化学习与在线反馈的动态调整，打造具备持续学习能力的大模型； 3）从工具辅助到全生命周期协作：以大模型为核心，推动需求到实现、测试到部署的智能化协作新范式，助力开发者在复杂工程项目中更高效地完成跨团队协作与长期维护； 4）领域知识与行业专属能力融入：通过引入行业领域知识库（如金融合规、医疗数据安全规范等），结合检索增强技术（RAG），确保生成代码符合行业标准，显著降低错误和安全隐患；三、主要挑战与应用前景 1、长序列代码与复杂上下文建模：复杂软件项目中，代码文件可能达到数千行，存在跨模块调用和多层次依赖，模型如何在长序列输入下保持上下文一致性，是核心技术难点之一； 2、跨语言与多框架适配：现有模型大多针对单一语言优化，而企业项目往往涉及多语言（如 Python、C++、Java 等）和多框架（如 React、Django、Kubernetes）。如何提升模型的跨语言泛化能力成为重要课题； 3、领域知识缺失与安全合规风险：通用大模型缺乏行业特定知识，可能生成不符合行业规范或存在潜在漏洞的代码，需引入领域知识与合规规则进行优化和增强； 4、人机协作：针对新涌现的大模型技术和应用场景，研究下一代软件研发人机交互形式，推动AI驱动的交互形式的普及与发展。

更新于 2025-03-05北京