logo of tongyi

通义通义实验室-算法专家-大语言模型基础算法研究

社招全职3年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学、人工智能、机器学习自然语言处理等领域的硕士及以上学历。
2. 具有LLM 系统,训练,评估 或强化学习相关方向经验。
3. 精通 Pytorch, Jax 等深度学习框架,具有较强的代码工程能力。

加分项:
1. 熟悉LLM的训练(如VeRL)和推理(如vLLM,SGLa…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:
LLM research 团队是隶属于阿里巴巴通义实验室的前沿研究团队,致力于解决大语言模型发展过程中的长期性、基础性挑战。我们的使命是打造具备通用智能的下一代AI系统,让模型真正具备深度推理、规划与复杂问题求解的能力,跨越任务与领域边界,从而在各类真实任务中展现可靠而深刻的智能。

1. 有效评估模型能力:建立系统性的评估方法与指标,准确刻画模型的行为表现与能力边界。
2. 探索模型的能力缺陷:挖掘当前主流模型在关键任务中的局限,理解其失败模式与成因。
3. 理解模型训练机制与问题:深入剖析大模型训练中的核心机制与潜在问题,为新范式设计提供理论支持。
4. 定义与探索更优训练范式:在实践中推动训练方法的演进,从而训练出更强大、更可靠、更智能的模型。
包括英文材料
机器学习+
NLP+
学历+
大模型+
强化学习+
PyTorch+
还有更多 •••
相关职位

logo of xiaohongshu
社招引擎

中台稠密引擎组,是小红书负责建设通用深度学习训练推理引擎的团队,面向全公司LLM、多模态LLM、SD、传统CV&NLP等稠密计算型模型训练与推理的业务场景,打造高效、易用、业界领先的训练与推理引擎,为小红书社区、商业化、安全等众多业务方向提供先进的引擎能力,支撑业务持续提升训练推理效率、模型迭代效率与算法研发效率。 1、参与设计和实现深度学习后训练及微调的前沿算法(包括但不限于RFT、RLHF等),以适应多样化的业务场景; 2、结合业务数据和场景,评估选择最适合的微调算法,以支撑业务大语言模型(LLM)微调指标的提升; 3、与数据团队紧密合作,深入理解数据特性,参与设计实现数据提质算法引擎工具,产出高质量数据集提升模型微调效果; 4、与公司内各算法团队深度合作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 5、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性;

上海|北京
logo of meituan
社招3年以上核心本地商业-美

1.负责美团平台地图服务的搜推算法策略迭代,优化用户搜推体验,提升地理位置搜索推荐准确率,提高用户点击率和转化率等核心指标; 2.应用大模型/NLP/深度学习/机器学习等理论和方法,优化查询理解、召回、粗排、精排、重排等算法模块; 3.负责前沿技术探索,包括大模型技术在搜索场景的落地应用。

更新于 2025-04-03北京
logo of youku
社招5年以上

优酷目前致力于研发剧作领域的高质量辅助工具。我们深信,剧作内容的生产是大语言模型落地最有可见价值,最有意思,同时也是最有挑战的领域之一。欢迎您加入我们,和我们一起探索,一起成长,一起见证前沿算法在高质量剧作内容生产中将要创造的奇迹,“为好内容,全力以赴”! 1、了解剧作逻辑,理解创作过程,链接剧作需求及算法原理,设计定义模型任务 2、设计制定高质量训练数据构造方案,完成数据制备 3、完成核心模型(大中型)的训练和调优。可以独立完成,也可以与他人合作,如果能指导他人完成则更好 4、跟进相关领域的学术及落地成果,探索在我们工作中的应用价值

更新于 2025-12-08北京
logo of xiaohongshu
社招3-5年大模型

【团队介绍】 小红书技术中台AI应用算法团队专注于图文、视频等场景下的大语言模型、多模态模型、扩散模型等技术的落地应用,通过标准化的AI技术能力支持公司各业务团队,提升技术资源利用率和业务创新迭代速度,持续优化技术研发成本并提升大规模AI应用的系统稳定性。团队兼具活跃的技术氛围、一线业务的真实挑战和相对充足的计算资源,欢迎有志于AGI、AIGC等方向的同学加入。 1、跟踪大语言模型、多模态、强化学习等算法的最前沿进展,将相应技术赋能到小红书实际的业务场景中,包括社区,商业化,交易等,持续推动AGI在业务场景下的落地应用; 2、基于成熟的AI平台服务,构建完善的AI原生应用和X+AI应用,包括如智能助理、知识问答、深度研究等,打造具有核心用户价值的热点应用; 3、探索大语言模型、多模态模型、扩散模型等在搜广推场景的落地方案。

更新于 2026-03-31北京|上海|杭州