通义研究型实习生-大规模预训练及推理的关键技术研究

实习兼职通义研究型实习生2025-07-10地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1、扎实的工程能力，熟悉Python/C++语言和常用设计模式，具备复杂系统的设计开发调试能力；
2、优良的沟通表达能力、团队合作意识和经验；具备快速学习的能力，以及深入钻研技术问题的耐心；
3、熟悉计算机体系结构基础知识，有扎实高性能计算(…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

专注于超大规模分布式LLM推理系统的研究、探索和开发，具体职责包括：
1、探索高性能的、可扩展的分布式LLM推理引擎，支持超大规模LLM的高效推理；
2、深入优化高性能算子、运行时、分布式策略等，打造业界领先的LLM推理引擎；
3、分析现有引擎和典型负载的性能瓶颈，提出并实现创新的优化技术；
4、针对LLM重点场景构建业界领先的框架和方案。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Python+

C+++

设计模式+

还有更多 •••

登录查看完整学习资料

相关职位

算法技术-冷启推荐研究型实习生项目-推荐算法实习生

实习淘天集团研究型实

1. 探索多模态（去ID化）在电商冷启场景的落地，优化冷启商品/内容的分发效率； 2. 探索冷启动与跨域推荐，构建可迁移的统一冷启推荐大模型，实现不同业务场景下的高效迁移和应用； 3. 优化大规模模态编码器的训练及推理策略，提高资源利用效率，降低模型训练时间和GPU内存消耗； 4. 结合以上方向的探索和研究，撰写发表论文，和业界、学术界保持良好的交流。

更新于 2025-05-06杭州

研究型实习生 - AI Frameworks系统软件前沿研究

实习阿里云研究型实习

【我们是谁？】阿里云智能是阿里巴巴集团的技术基石，致力于以在线公共服务的方式，提供安全、可靠的计算和数据处理能力。我们的团队专注于机器学习系统（MLSys）的前沿研究与工程实践，特别是为“通义”系列大规模语言模型（LLM）的训练、推理提供坚实的系统支撑。在这里，你将有机会参与构建和优化支撑万亿参数级别模型的超级工程，直接影响亿万用户的AI体验。【为什么这个机会不容错过？——来自工业界的真实挑战与机遇】大规模语言模型的研发是一项复杂的端到端系统工程。从海量数据的高效处理、万卡集群的分布式训练、精细化的后训练调优，到低延迟高吞吐的推理服务和云上弹性部署，每一个环节都充满了挑战，也孕育着巨大的创新机会。我们认为，虽然算法创新是驱动力，但在LLM的整个生命周期中，系统扮演着至关重要的角色。以下是我们正在“通义”大模型及相关场景下积极探索并期待与你共同攻克的挑战： 1.超大规模预训练系统优化：追求极致效率与稳定性 ·系统行为的深度洞察：在万卡集群并行训练的极致规模下，如何设计高效、低侵扰的追踪系统（Tracing System）以精准理解系统真实运行状态，本身就是一个难题。例如，仅网络层追踪就面临数据量爆炸性增长的挑战，如何在海量数据中高效提取关键信息，指导性能优化。 ·并行策略的自动化与智能化：随着模型结构的快速迭代，如何针对新型架构自动设计并调整最优的并行策略（张量并行、流水线并行、数据并行、序列并行及其混合），在复杂的内存、计算、通信约束下取得最佳平衡，减少人工调优的巨大成本。 ·大规模集群的韧性与容错：尽管我们拥有先进的异步、跨多级存储的Checkpointing机制，但GPU集群的故障（硬件、软件、网络等）仍会导致训练中断和时间浪费。如何进一步提升系统的容错恢复能力，最大限度减少故障影响，保障训练任务的连续性和效率。 2.后训练（RLHF等）中的算法-系统协同设计：提升“智能”的性价比 ·复杂工作流的高效资源调度：后训练阶段（如RLHF）涉及采样、训练、评估等多个计算特点各异的任务。如何设计智能调度系统，自动、高效地为这些任务分配和管理计算、存储、网络资源，以最小化总体资源消耗，或最大化单位资源投入下模型效果的提升“斜率”。 ·算法与系统协同进化：后训练的算法仍在快速演进，如何设计灵活、可扩展的系统架构，以适应算法的不断变化，并反过来通过系统创新启发新的算法可能性。 3.云原生推理服务：敏捷、高效、经济地赋能万千应用 ·多样化业务负载与SLA保障：云上推理业务场景丰富，客户对吞吐量、延迟、成本等有着不同的服务等级协议（SLA）要求。如何设计统一而灵活的推理服务系统，满足从离线批量推理到在线实时服务的各种需求。 ·推理优化技术的敏捷集成与工程化：学术界和开源社区的推理优化技术（如量化、剪枝、FlashAttention、PagedAttention、投机采样、模型编译等）日新月异。如何构建一套敏捷的工程体系，快速评估、吸收、融合这些前沿技术，并将其稳定部署到在线服务中，持续提升推理效率。 ·极致的资源弹性与成本效益：在云环境中，如何通过精细化的资源调度、高效的多租户管理以及智能的流量预测，应对业务负载的剧烈波动，最大限度地减少空闲资源浪费，为用户提供最具成本效益的LLM服务。

更新于 2025-06-03杭州|上海

研究型实习生-国际跨境交易场景AI及智能体技术应用

实习研究型实习生

研究领域：人工智能项目简介：蚂蚁国际当前处于全球化和AI规模化应用的战略关键节点中，为支持多条业务线的业务规模化增长，蚂蚁国际风控致力于AI的创新及其在风控场景的应用。应用场景包括但不限于基于多智能体的风控决策系统， Deepfake识别，风控深度推理大模型等解决实际业务痛点。团队鼓励创新，勇于探索及突破前沿AI能力边界。 1.负责foundation model和生成式AI智能体构建，追踪业界文本生成、思维学习、内容理解等方向的最新技术，极致优化预训练、微调、领域知识注入、RLHF、RM、AI可解释能力。 2.负责AI技术前沿技术跟踪、创新和落地，例如，利用意图理解、图文理解等构建新一代的生成式审核机器人与辅助系统，运用反馈标注、知识体系建设、知识图谱构建等任务；利用多模态技术对图像、文本、结构化数据进行融合学习，致力于挖掘风控场景问题并全面提升风险运营效率，并帮助实现对合规、欺诈、洗钱等风险的高效管控。 3.深入跟踪调研前沿技术方向，包括但不限于 NLP/CV/多模态/智能体等，并适时进行技术分享。推动相关领域技术创新，进行专利申请和学术文章发表，产出至少一篇CCF-A以上论文。

上海

LLM大模型应用算法实习生

实习淘天集团研究型实

1. Agent方向：直接参与到导购Agent的算法研发工作，包含无障碍导购Agent、搜索导购Agent两个Agent项目并结合技术创新与实际业务落地，产出高质量论文、专利与开源成果。包括相关项目的高质量数据构建，支撑复杂任务建模与行为学习，运用大模型SFT、RL等Post-training训练方法并探索 Online RL 等前沿方法，设计并落地“过程监督 + 结果监督”联合训练范式，融合MCTS、ToT、Reflection等推理方法，等等； 2. LLM应用方向：探索基于LLM的Query理解大模型，通过天猫的数据微调大模型生成ID表征向量，在搜索和推荐算法各模块进行深度的探索和应用。包括但不限于语义相关性、类目预测、召回排序等。探索生成式搜索技术（如Query扩展、结果摘要生成），助力搜索从“信息呈现”向“决策辅助”升级； 3. 结合业务需求，设计和扩展LLM的应用场景范围及规模，提高模型微调后再垂直领域的应用及专家模式的架构尝试； 4. 跟踪LLM与Agent领域的国际前沿技术动态，开展前沿算法的研究工作，推动技术创新在业务场景中的落地应用，重点突破复杂推理、GUI Agent、AI搜索等方向的技术沉淀和业务创新。

更新于 2026-01-12杭州