logo of kuaishou

快手大模型预训练/后训练算法专家

社招全职3-5年D12518地点:北京状态:招聘

任职要求


1、自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业硕士及以上学历;
2、在NLPLLM深度学习强化学习方面有一定研究基础,熟悉主流大模型算法,并有丰富的实践经验;
3、较强的工程实现能力,熟练掌握 pytorch,熟悉DeepSpeed、Megatron、NeMo等分布式训练框;
4、有高质量论文发表者优先(如ACL、EM…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、预训练模型结构和训练任务优化,提升预训练模型学习世界知识的能力;
2、持续收集和清洗大规模预训练数据,并研究数据构成和学习顺序对大模型效果的影响;
3、参与预训练模型评测,包括评测流程建设和完善、评测方法设计和优化等;
4、参与大模型Alignment相关工作,包括:
a.Alignment方法设计与研究,包括SFT和 RLHF等相关的算法研究;
b.Alignment整体数据建设,包括数据构建、标注以及分析其对模型能力的影响;
c.从下游调优的角度探索如何提升大模型的逻辑推理能力。
包括英文材料
NLP+
机器学习+
模式识别+
学历+
大模型+
深度学习+
强化学习+
算法+
PyTorch+
还有更多 •••
相关职位

logo of tencent
社招5年以上混元-模型算法技

1.负责生成式大模型预训练相关的工作,包括但不限于:大规模模型预训练,长文本预训练,线性模型结构探索; 2.探索与跟进前沿技术,寻求技术突破,推动机器在AIGC能力的提升和突破; 3.探索高效的模型知识嵌入方法以及模型知识在线学习更新; 4.探索文本模型预训练的scaling law,在小规模小成本下更精准地预测大规模训练后的表现。

更新于 2025-12-31北京
logo of dewu
社招技术类

1、深入理解电商平台业务场景,负责自然语言处理(NLP)、语义分析、人机对话模型等核心算法的研究与实现; 2、基于电商业务场景数据,重点负责大模型后训练算法,以及策略优化等相关工作; 3、负责搭建和优化Agentic系统,挑战将前沿Agent架构和算法应用于大规模电商核心业务,打开业务增长空间。 4、跟踪行业前沿技术,探索Agentic RL、DeepSearch、高效大模型等技术,参与新一代基座模型的调优与创新。

更新于 2026-01-08上海|北京
logo of antgroup
社招3年以上技术类-算法

负责蚂蚁集团语言大模型的评测算法研究与应用,搭建业界领先的大模型评测体系,精准全面地评估大模型的能力。基于AIGC等技术建设高质量评测数据集,与业界公开评测集有机结合,深入大模型预训练、后训练、深度思考等各个阶段,利用大模型等技术提高评测效率和准确性,通过高效高质量评测提升语言大模型、垂域大模型的能力和用户体验。

更新于 2026-01-14北京|杭州
logo of alibaba
社招2年以上

1. 负责多模态大模型的核心技术攻坚和效果优化,基于平台垂直领域专业知识积累,面向百亿级商品实现结构化和细颗粒度的视觉理解能力,推动生成模型在效果和控制力上实现业界领先; 2. 借助大模型和大数据洞察能力,帮助服饰快时尚行业搭建从企划、设计、商详到孵化的全链路AI Agent解决方案,为行业带来新的商业模式和增长点。

更新于 2026-04-07杭州