logo of kuaishou

快手大模型预训练/后训练算法专家

社招全职3-5年D12518地点:北京状态:招聘

任职要求


1、自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业硕士及以上学历;
2、在NLPLLM深度学习强化学习方面有一定研究基础,熟悉主流大模型算法,并有丰富的实践经验;
3、较强的工程实现能力,熟练掌握 pytorch,熟悉DeepSpeed、Megatron、NeMo等分布式训练框;
4、有高质量论文发表者优先(如ACL、EM…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、预训练模型结构和训练任务优化,提升预训练模型学习世界知识的能力;
2、持续收集和清洗大规模预训练数据,并研究数据构成和学习顺序对大模型效果的影响;
3、参与预训练模型评测,包括评测流程建设和完善、评测方法设计和优化等;
4、参与大模型Alignment相关工作,包括:
a.Alignment方法设计与研究,包括SFT和 RLHF等相关的算法研究;
b.Alignment整体数据建设,包括数据构建、标注以及分析其对模型能力的影响;
c.从下游调优的角度探索如何提升大模型的逻辑推理能力。
包括英文材料
NLP+
机器学习+
模式识别+
学历+
大模型+
深度学习+
强化学习+
算法+
PyTorch+
还有更多 •••
相关职位

logo of tencent
社招5年以上混元-模型算法技

1.负责生成式大模型预训练相关的工作,包括但不限于:大规模模型预训练,长文本预训练,线性模型结构探索; 2.探索与跟进前沿技术,寻求技术突破,推动机器在AIGC能力的提升和突破; 3.探索高效的模型知识嵌入方法以及模型知识在线学习更新; 4.探索文本模型预训练的scaling law,在小规模小成本下更精准地预测大规模训练后的表现。

更新于 2025-12-31北京
logo of dewu
社招技术类

1、深入理解电商平台业务场景,负责自然语言处理(NLP)、语义分析、人机对话模型等核心算法的研究与实现; 2、基于电商业务场景数据,重点负责大模型后训练算法,以及策略优化等相关工作; 3、负责搭建和优化Agentic系统,挑战将前沿Agent架构和算法应用于大规模电商核心业务,打开业务增长空间。 4、跟踪行业前沿技术,探索Agentic RL、DeepSearch、高效大模型等技术,参与新一代基座模型的调优与创新。

更新于 2026-01-08上海|北京
logo of antgroup
社招3年以上技术类-算法

负责蚂蚁集团语言大模型的评测算法研究与应用,搭建业界领先的大模型评测体系,精准全面地评估大模型的能力。基于AIGC等技术建设高质量评测数据集,与业界公开评测集有机结合,深入大模型预训练、后训练、深度思考等各个阶段,利用大模型等技术提高评测效率和准确性,通过高效高质量评测提升语言大模型、垂域大模型的能力和用户体验。

更新于 2026-01-14北京|杭州
logo of tongyi
社招3年以上技术类-算法

1. 探索研究多模态生成大模型的设计与开发,探究高效生成、生成理解统一、多模态理解、强化学习/RLHF后训练和高效数据管线设计等方向。 2. 参与研发多模态生成大模型开发等下一代人工智能核心技术,参与大规模生成基础模型预训练与后训练开发。 3. 负责跟踪和研究多模态生成大模型前沿技术调研、落地、对业务进行优化。

更新于 2026-01-16北京|杭州