logo of xiaohongshu

小红书大模型算法工程师

社招全职大模型地点:北京 | 上海状态:招聘

任职要求


1、本科及以上学历,计算机、人工智能和数学等相关专业,博士研究生优先;
2、熟练掌握扩散模型设计和使用技巧,在知名大模型公司/团队从事图像或视频生成者优先,有多模态/OMNI大模型理解&生成统一框架经验者优先;
3、有丰富的大模型预训练和后训练数据处理经验,熟练掌握数据收集、数据清洗、数据去重和数据合成等流程,能针对数据质量制定出评估指标和方法,在知名大模型公司/团队长期从事数据技术者优先;
4、MoE/Dense模型训练实战经验,包括模型预训练、RL Reasoning、SFT和RLHF等,熟练掌握各种模型训练和推理技巧,在大模型前沿技术领域有深度探索,发表过顶会论文、技术报告者优先;
5、熟悉大模型训练和推理框架,熟练掌握模型并行、数据并行和流水线设计等技巧,在知名大模型公司/团队长期从事AI Infra者优先;
6、熟悉各类评测基准和构造技巧,熟练掌握大模型客观评测和主观评测方法,在知名大模型公司/团队长期从事大模型评测者优先;
7、有良好代码能力,熟练掌握PythonC++JAVA等编程技能,知名开源项目核心贡献者优先,ACM/ICPC竞赛获奖者优先,国内外知名数据挖掘比赛(例如KDD Cup等)中取得领先名次者优先。

工作职责


1、探索新一代大语言模型基座架构,完成扩散模型(diffusion model)在大语言模型的重塑,突破逐个token预测的方式,实现高效的推理模式,探索全新scaling law;
2、实现大模型训练的数据清洗、合成和评估;设计和实现大模型训练的AI Infra框架。
包括英文材料
学历+
大模型+
SFT+
Python+
C+++
Java+
数据挖掘+
相关职位

logo of pinduoduo
社招技术类

1、负责大模型设计和开发工作,包括模型设计、prompt优化、预训练、模型加速、数据集建设等; 2、结合业务需求,实现电商平台业务场景的智能化、自动化升级。

更新于 2025-03-31
logo of jd
社招1年以上算法开发岗

1、参与生成式大模型能力构建;不局限于模型设计、prompt优化、预训练、模型推理加速、其他能力建设等; 2、采用最先进的并行处理和分布式学习技术,制定并执行性能优化策略,显著提升大型语言模型的训练速度和推理能力,例如跟进DeepSeek R1技术架构等,确保技术行业领先; 3、推进大模型技术在京东物流各个业务场景落地,包括不限于智能问答、智能数据分析、智能决策以及Computer Use等,助力业务流程优化,增质提效; 4、深度探索大语言模型方向,保持技术领先优势,推动京东物流在行业内树立高效、精准的大模型/多模态大模型应用标杆,并取得业务收益。

更新于 2025-06-09
logo of meituan
社招核心本地商业-基

1、负责端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、负责训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 4、负责大模型算法策略的设计、研发和优化,提升系统性能和稳定性

更新于 2025-06-19
logo of mi
社招3年以上A215198

1. 负责将大模型技术应用于文本内容生成等业务领域,推动大模型技术匹配及赋能目标业务场景; 2. 负责大模型预训练和微调算法的研发平台搭建,以及大模型预训练和微调语料的处理与维护等; 3. 负责基于大模型算法的开发与优化,包括大模型增量预训练、高效微调、推理优化,解决落地过程中的算法和工程技术难题; 4. 负责追踪学术界和工业界在大模型预训练、微调、强化学习等方向的前沿进展,持续进行模型框架和训练方法的优化迭代;

更新于 2025-04-15