logo of jd

京东大模型算法工程师

社招全职算法开发岗地点:北京状态:招聘

任职要求


1.扎实的机器学习NLP、RL基础和出色的创新能力,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先;
2.在预训练、后训练、强化学习方向有深刻研究;
3.优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,A…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.研究实现AGI的关键能力,通过技术愿景驱动研究工作。负责大语言模型和多模态大模型的训练和优化(包括预规划、后训练等)长期课题的研究,提升大语言模型的能力,并在广泛业务场景中产生价值。
2.负责LLM训练相关的工作,包括后预训练、Instruction Tuning以及强化学习等;
3.深入参与数据及评估体系建设、大规模训练、指令微调、偏好对齐、模型优化等关键工作;
4.探索大模型底层技术突破,深入大模型基础架构前沿研究(如MoE、注意力机制、x等),探索新型架构和技术创新。
包括英文材料
机器学习+
NLP+
ACL+
EMNLP+
NeurIPS+
ICML+
强化学习+
还有更多 •••