logo of kuaishou

快手大模型预训练/后训练算法专家

社招全职D12518地点:北京状态:招聘

任职要求


1、自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业硕士及以上学历;
2、在NLPLLM深度学习强化学习方面有一定研究基础,熟悉主流大模型算法,并有丰富的实践经验;
3、较强的工程实现能力,熟练掌握 pytorch,熟悉DeepSpeedMegatron、NeMo等分布式训练框;
4、有高质量论文发表者优先(如ACL、EMNLP、NeurIPSICMLICLR等);
5、有大规模基础模型预训练工作经验者优先;
6、熟悉计算机视觉相关任务,对图像/视频分类、目标检测、图像/视频检索、OCR、图像分割等至少一方面有经验优先;
7、 熟悉图像、文本、多模态等领域最前沿的大模型,并具有相关经验者优先;
8、具备强烈的进取心、自驱力及团队合作精神,热衷于追求技术创新。

工作职责


1、预训练模型结构和训练任务优化,提升预训练模型学习世界知识的能力;
2、持续收集和清洗大规模预训练数据,并研究数据构成和学习顺序对大模型效果的影响;
3、参与预训练模型评测,包括评测流程建设和完善、评测方法设计和优化等;
4、参与大模型Alignment相关工作,包括:
a.Alignment方法设计与研究,包括SFT和 RLHF等相关的算法研究;
b.Alignment整体数据建设,包括数据构建、标注以及分析其对模型能力的影响;
c.从下游调优的角度探索如何提升大模型的逻辑推理能力。
包括英文材料
NLP+
机器学习+
模式识别+
学历+
大模型+
深度学习+
强化学习+
算法+
PyTorch+
DeepSpeed+
Megatron+
NeurIPS+
ICML+
OpenCV+
OCR+
相关职位

logo of antgroup
社招技术类-算法

负责蚂蚁集团语言大模型的评测算法研究与应用,搭建业界领先的大模型评测体系,精准全面地评估大模型的能力。基于AIGC等技术建设高质量评测数据集,与业界公开评测集有机结合,深入大模型预训练、后训练、深度思考等各个阶段,利用大模型等技术提高评测效率和准确性,通过高效高质量评测提升语言大模型、垂域大模型的能力和用户体验。

更新于 2025-07-14
logo of tongyi
社招3年以上技术类-算法

1. 探索研究多模态生成大模型的设计与开发,探究高效生成、生成理解统一、多模态理解、强化学习/RLHF后训练和高效数据管线设计等方向。 2. 参与研发多模态生成大模型开发等下一代人工智能核心技术,参与大规模生成基础模型预训练与后训练开发。 3. 负责跟踪和研究多模态生成大模型前沿技术调研、落地、对业务进行优化。

更新于 2025-10-16
logo of alibaba
社招2年以上

1. 负责多模态大模型的核心技术攻坚和效果优化,基于平台垂直领域专业知识积累,面向百亿级商品实现结构化和细颗粒度的视觉理解能力,推动生成模型在效果和控制力上实现业界领先; 2. 借助大模型和大数据洞察能力,帮助服饰快时尚行业搭建从企划、设计、商详到孵化的全链路AI Agent解决方案,为行业带来新的商业模式和增长点。

更新于 2025-10-17
logo of quark
社招3年以上技术类-算法

1. 探索研究多模态生成大模型的设计与开发,探究高效生成、生成理解统一、多模态理解、强化学习/RLHF后训练和高效数据管线设计等方向; 2. 参与研发多模态生成大模型开发等下一代人工智能核心技术,参与大规模生成基础模型预训练与后训练开发。 3. 负责跟踪和研究多模态生成大模型前沿技术调研、落地、对业务进行优化。

更新于 2025-08-22