logo of alibaba

阿里巴巴未来生活实验室-大模型训练算法专家(代码方向)-北京/杭州

社招全职4年以上地点:北京 | 杭州状态:招聘

任职要求


1.	技术能力
	•	精通Transformer架构,熟悉LLM训练优化技术(如Megatron-LM、DeepSpeed);
	•	掌握代码解析与表征技术(AST、代码抽象语法树、静态分析工具);
	•	具备强化学习(PPO、DPO)、多智能体系统(MARL)实战经验;
	•	熟悉代码生成领域前沿技术(如Repo-Level Modeling、Self-Repair)。
2.	工程经验
	•	有代码大模型训练经验(如CodeLlama、StarCoder、DeepSeek-Coder);
	•	熟悉代码工具链(编译器、静态分析器、IDE插件开发)
3.      加分项
	•	在顶级会议(ICLRNeurIPS、ICSE)发表代码相关论文;
	•	主导过开源代码模型项目(训练/微调/部署全流程);
	•	具备复杂系统开发经验(分布式系统、编译器、数据库内核)。
4.       我们提供
	•	参与定义下一代智能编程范式的机会;
	•	与顶尖团队共同攻克代码大模型技术无人区;
	•	技术成果直接赋能百万开发者,推动编程效率革命。

工作职责


1.     基座模型能力建设
	•	主导代码大模型(Code LLM)的预训练与优化,涵盖代码生成、补全、理解、翻译、调试等核心能力;
	•	设计高效的多语言代码表征架构(如Python、Java、C++等),支持长上下文学习(Long Context)与复杂逻辑推理;
	•	探索代码语料(GitHub、Stack Overflow等)与自然语言的高效对齐技术,提升模型对开发者意图的理解能力。
2.	Agent协同与系统化落地
	•	构建代码智能体(Code Agent)协作框架,整合代码解释器、测试框架、知识检索模块,实现多工具联合推理;
	•	开发动态任务调度策略,支持多智能体分工解决复杂编程问题(如系统设计、全栈开发、自动化测试);
	•	推动模型在类似Cursor的代码工具中落地,实现代码生成、智能补全、错误诊断、跨语言迁移等核心功能。
3.	多智能体代码系统
	•	设计多智能体协同架构,支持代码生成、评审、迭代优化的闭环流程;
	•	探索智能体自主协作机制(如分工协商、结果校验、知识共享),提升复杂工程问题的解决效率;
	•	结合业务场景(如企业级代码库重构、自动化运维),打造端到端代码解决方案。
包括英文材料
Transformer+
大模型+
Megatron+
DeepSpeed+
强化学习+
NeurIPS+
分布式系统+
内核+
智能体+
相关职位

logo of quark
社招1年以上技术类-算法

1. 探索研究多模态理解、视频理解等方向的前沿技术; 2. 关注多模态、全模态大模型的后训练相关技术,研判RL在多模态理解上的潜力;

更新于 2025-08-27
logo of antgroup
社招技术类-算法

1. 负责研发大语言模型强化学习算法,提升大模型在强化学习阶段的训练效率,以及提升大模型在数学、代码等自然科学领域的推理能力 2. 负责研发奖励和评价模型,包括细粒度的过程监督和奖励建模,覆盖复杂推理、指令遵循等各种任务 3. 参与后训练和推理阶段的Scaling Law研究,包括奖励模型训练、强化学习训练、推理阶段的Scaling Law

更新于 2025-06-19
logo of tongyi
社招3年以上技术类-算法

团队介绍: LLM research 团队是隶属于阿里巴巴通义实验室的前沿研究团队,致力于解决大语言模型发展过程中的长期性、基础性挑战。我们的使命是打造具备通用智能的下一代AI系统,让模型真正具备深度推理、规划与复杂问题求解的能力,跨越任务与领域边界,从而在各类真实任务中展现可靠而深刻的智能。 1. 有效评估模型能力:建立系统性的评估方法与指标,准确刻画模型的行为表现与能力边界。 2. 探索模型的能力缺陷:挖掘当前主流模型在关键任务中的局限,理解其失败模式与成因。 3. 理解模型训练机制与问题:深入剖析大模型训练中的核心机制与潜在问题,为新范式设计提供理论支持。 4. 定义与探索更优训练范式:在实践中推动训练方法的演进,从而训练出更强大、更可靠、更智能的模型。

更新于 2025-09-04
logo of alibaba
社招3年以上

商品基础算法团队是淘天集团核心的商品理解中台,负责对淘天全域(淘宝、天猫等)数百亿的商品进行深度、精准、多维度的内容理解。我们产出的商品认知能力(如属性、卖点、风格、品类、知识),是整个淘天搜索、推荐、广告、AIGC应用、智能导购、直播等所有核心业务的基石,直接决定了用户“逛”和“买”的体验,是连接“人”与“货”的智能引擎。 当前,我们正处在用新一代AI技术(大模型、多模态大模型)彻底重塑商品世界的历史机遇期。在这里,你将接触到全球最丰富、最复杂的电商多模态数据,有机会定义下一代商品理解的技术范式,你的工作成果将通过集团各大业务场景,影响亿万用户的消费决策。 岗位职责: 1. 构建业界领先的商品多模态理解体系: 负责利用大语言模型(LLM)及视觉语言模型(VLM)等前沿技术,对商品的多模态内容(文本标题、详情描述、图片、视频等)进行深度解析,完成高质量的标签抽取、卖点挖掘、风格识别、需求理解等核心任务。 2. 探索大模型背景下的下一代商品知识库的构建范式:如何从海量商品信息、用户评论、行业知识中自动化构建知识体系?如何解决知识的事实性问题?如何在庞大、有噪声的知识库中抽取有效知识,用于下游落地和应用 3. 负责大模型/多模态模型的前沿技术探索与落地: 跟踪并实践领域内前沿的模型和技术(如模型Fine-tuning, RAG, In-Context Learning, Agent, Model Distillation等),结合业务场景进行技术选型、方案设计与模型优化,解决从训练到部署全链路的挑战,实现技术创新与业务效果的双赢。 4. 设计和优化算法架构与系统: 负责商品理解算法系统的整体架构设计与持续迭代,保证系统的高性能、高可用和高扩展性,以应对淘天集团海量数据的挑战。 5. 驱动技术创新转化为业务价值: 深入理解业务,主动挖掘技术能创造价值的场景,与产品、工程团队紧密协作,通过严谨的AB实验验证算法效果,用技术力量持续驱动业务指标增长。

更新于 2025-10-15