logo of tongyi

通义通义实验室-算法专家-大语言模型基础算法研究

社招全职3年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学、人工智能、机器学习自然语言处理等领域的硕士及以上学历。
2. 具有LLM 系统,训练,评估 或强化学习相关方向经验。
3. 精通 Pytorch, Jax深度学习框架,具有较强的代码工程能力。

加分项:
1. 熟悉LLM的训练(如VeRL)和推理(如vLLMSGLang)系统。
2. 曾发表顶级会议论文并具有一定的学术影响力,包括但不限于:NeurIPSICMLICLR、ACL等国际顶级计算机会议/期刊。
3. 拥有知名开源项目,在开源社区具有较好的影响力,或在有大量的LLM开发训练经验。
4. 对LLM的能力,系统,数据,训练和评估有深入的逻辑思考。

工作职责


团队介绍:
LLM research 团队是隶属于阿里巴巴通义实验室的前沿研究团队,致力于解决大语言模型发展过程中的长期性、基础性挑战。我们的使命是打造具备通用智能的下一代AI系统,让模型真正具备深度推理、规划与复杂问题求解的能力,跨越任务与领域边界,从而在各类真实任务中展现可靠而深刻的智能。

1. 有效评估模型能力:建立系统性的评估方法与指标,准确刻画模型的行为表现与能力边界。
2. 探索模型的能力缺陷:挖掘当前主流模型在关键任务中的局限,理解其失败模式与成因。
3. 理解模型训练机制与问题:深入剖析大模型训练中的核心机制与潜在问题,为新范式设计提供理论支持。
4. 定义与探索更优训练范式:在实践中推动训练方法的演进,从而训练出更强大、更可靠、更智能的模型。
包括英文材料
机器学习+
NLP+
学历+
大模型+
强化学习+
PyTorch+
JAX+
深度学习+
vLLM+
SGLang+
NeurIPS+
ICML+
相关职位

logo of aliyun
社招2年以上云智能集团

【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【职位介绍】 1、负责AI for Science尤其是生物医药方向的基础算法的研究和研发落地,包括不限于蛋白语言模型,基因语言模型,分子基础模型,生成式生物模型等。 2、对AI for Science尤其是基因全链路分析,药物早筛等问题中涉及的智能化和生成式模型等技术进行快速试错,找到可行方案,并不断对其进行创新改进,在各项性能指标上超出现有方案,不断提升行业天花板,不断完善相应的服务化工具。 3、以人工智能技术和高性能计算为基础,在相关方向产出高水平的文章,专利和软件服务,完善公司在AI for Science方面的技术布局,提升公司在相关领域的影响力。

更新于 2025-10-18
logo of bytedance
社招A235756

1、负责基础模型和Generative AI的基础能力建设,追踪业界文本生成/翻译、图生文、deepfake等方向的最新技术,极致优化预训练、微调、领域知识注入、RLHF、RM、AI Safety等能力; 2、将AIGC相关技术在广告、电商、短视频、直播等商业产品的内容理解上落地,构建新一代基于大模型的商业化生态; 3、从事强化学习与大语言模型智能体(LLM-based Agent)相结合的交叉研究与应用落地; 4、探索大模型高效训练/推理方案。

更新于 2024-03-11
logo of bytedance
社招A114940

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、擅长发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、探索超大规模模型边界,并进行极致系统优化,提升模型性能和效率; 3、推进数据建设、指令微调、偏好对齐、模型优化方面的工作,提高模型质量和适应性; 4、相关应用落地,包括生成创作、逻辑推理、代码生成等; 5、深入研究和探索模型在未来生活中的更多使用场景,拓展模型的应用范围。

更新于 2023-12-19
logo of bytedance
社招A58208

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、擅长发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、探索超大规模模型边界,并进行极致系统优化,提升模型性能和效率; 3、推进数据建设、指令微调、偏好对齐、模型优化方面的工作,提高模型质量和适应性; 4、相关应用落地,包括生成创作、逻辑推理、代码生成等; 5、深入研究和探索模型在未来生活中的更多使用场景,拓展模型的应用范围。

更新于 2023-11-20