logo of tongyi

通义大语言模型基础算法研究工程师

校招全职通义2026届秋季校园招聘地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学、人工智能、机器学习自然语言处理等领域的博士/硕士/本科毕业生。
2. 具有LLM 系统,训练,评估 或强化学习相关方向经验。
3. 精通 Pytorch, Jax 等深度学习框架,具有较强的代码工程能力。

加分项:
1. 熟悉LLM的训练(如VeRL)和推理(如vLLM,SG…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:
LLM research 团队是隶属于阿里巴巴通义实验室的前沿研究团队,致力于解决大语言模型发展过程中的长期性、基础性挑战。我们的使命是打造具备通用智能的下一代AI系统,让模型真正具备深度推理、规划与复杂问题求解的能力,跨越任务与领域边界,从而在各类真实任务中展现可靠而深刻的智能。

1. 有效评估模型能力:建立系统性的评估方法与指标,准确刻画模型的行为表现与能力边界。
2. 探索模型的能力缺陷:挖掘当前主流模型在关键任务中的局限,理解其失败模式与成因。
3. 理解模型训练机制与问题:深入剖析大模型训练中的核心机制与潜在问题,为新范式设计提供理论支持。
4. 定义与探索更优训练范式:在实践中推动训练方法的演进,从而训练出更强大、更可靠、更智能的模型。
包括英文材料
机器学习+
NLP+
大模型+
强化学习+
PyTorch+
JAX+
还有更多 •••
相关职位

logo of xiaohongshu
社招引擎

中台稠密引擎组,是小红书负责建设通用深度学习训练推理引擎的团队,面向全公司LLM、多模态LLM、SD、传统CV&NLP等稠密计算型模型训练与推理的业务场景,打造高效、易用、业界领先的训练与推理引擎,为小红书社区、商业化、安全等众多业务方向提供先进的引擎能力,支撑业务持续提升训练推理效率、模型迭代效率与算法研发效率。 1、参与设计和实现深度学习后训练及微调的前沿算法(包括但不限于RFT、RLHF等),以适应多样化的业务场景; 2、结合业务数据和场景,评估选择最适合的微调算法,以支撑业务大语言模型(LLM)微调指标的提升; 3、与数据团队紧密合作,深入理解数据特性,参与设计实现数据提质算法引擎工具,产出高质量数据集提升模型微调效果; 4、与公司内各算法团队深度合作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 5、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性;

上海|北京
logo of baidu
社招3年以上ACG

-负责大模型应用开发平台的算法设计与优化,提升开发者在平台上的体验与应用效率 -研究并应用前沿的深度学习和机器学习算法,推动大模型在实际业务场景中的应用落地,重点关注RAG、Agent、工作流等能力方向 -深入掌握Function Call,代码解释器,Post-training等原理及常用方法 -与产品、工程团队紧密合作,理解业务需求,制定相应的算法解决方案 -持续优化算法的效率和效果,确保平台的高性能和高可用性

更新于 2025-03-27北京
logo of meituan
社招核心本地商业-业

1.负责美团搜索查询理解、召回、排序各阶段的算法模型优化,提升搜索效果。 2.负责美团搜索前沿技术探索,包括大模型技术在搜索场景的落地应用。

更新于 2025-04-03北京
logo of bytedance
社招A191024

1、负责音乐相关业务的大语言模型的研发和应用,相关研发技术和解决方案在抖音、汽水音乐等产品中应用,满足音乐相关业务场景中的用户不断增长的智能交互需求,全面提升用户在音乐相关的创作和消费场景的体验; 2、参与音乐相关大模型的研发,如音乐预训练、音乐多模态模型等; 3、参与大模型技术在音乐场景中的探索和相关应用落地,如音乐搜推、音乐助手、视频配乐等; 4、在音乐人工智能领域开展前沿研究,在未来生活中的更多音乐相关的使用场景的深入研究和探索。

更新于 2025-03-17北京