logo of tencent

腾讯大语言模型算法研究员(北京)(上海)

社招全职CSIG技术地点:深圳状态:招聘

任职要求


1.计算机科学、数学、统计学或相关领域硕士及以上学历;
2.具备强逻辑思维与问题拆解能力,能独立完成技术调研与实验设计;
3.了解Smol、MetaGPT等智能体框架,具备智能体系统开发经验者优先;
4.在ACL/EMNLP/NeurIPS等顶会发表过论文,或参与过开源项目贡献者优先;
5.熟练掌握PyTorch框架,熟悉主流大模型架构及训练方法;
6.熟悉大模型全流程开发经验,包括数据清洗、分布式训练、效果…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责大语言模型的算法研发与优化,包括继续预训练、指令微调(SFT)、强化学习对齐(RLHF/DPO)、智能体等环节的技术探索;
2.推动LLM在垂直领域(如智能客服、金融分析、电商场景)的落地应用,设计多轮对话、逻辑推理、函数调用等能力优化方案;
3.跟踪学术界与工业界最新进展,推动创新技术在产品中的集成应用。
包括英文材料
学历+
NeurIPS+
还有更多 •••
相关职位

logo of bytedance
社招A94044

团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、负责视觉理解模型建设中的1条或多条训练管线,建设高质量、多样性的数据,探索数据配方的奥秘; 2、负责模型训练的Benchmark的建设,打造世界数据集和基准; 3、负责模型训练过程中的所必须的基础架构和平台能力建设,探索模型训练的基础架构和平台研发范式; 4、解决大规模数据生成的成本和分布式性能问题,一起尝试去定义Data for LLM 和AI for LLM Data的研发新范式; 5、探索把AI技术应用在大模型的全生命周期中,包括不限于数据建设、数据生成、指令微调、偏好对齐等。

更新于 2024-03-25北京
logo of bytedance
社招A117221B

团队介绍:BandAI团队致力于探索智能的极限在交易场景的可能性。团队研究方向涵盖LLM、Multimodal、Agent,在北京、上海设有实验室和岗位。加入我们,参与到前沿的大语言模型的研究课题,和优秀的研究员一起探索智能极限。 1、成为研究型人才,在你热爱的课题方向上,探索多模态大模型模型领域最具挑战的长期关键问题; 2、探索研究多模态理解、生成式、强化学习、AIGC等前沿技术; 3、探索多模态RAG、视觉COT、多模态Agent、多模态Reward model、RL等多模态进阶能力; 4、探索多模态Deep research、Computer Using Agent、Useful Image Generation、理解生成一体模型在抖音交易场景的能力。

更新于 2025-05-20北京
logo of bytedance
社招A169208

团队介绍:BandAI团队致力于探索智能的极限在交易场景的可能性。团队研究方向涵盖LLM、Multimodal、Agent,在北京、上海设有实验室和岗位。加入我们,参与到前沿的大语言模型的研究课题,和优秀的研究员一起探索智能极限。 1、成为研究型人才,在你热爱的课题方向上,探索多模态大模型模型领域最具挑战的长期关键问题; 2、探索研究多模态理解、生成式、强化学习、AIGC等前沿技术; 3、探索多模态RAG、视觉COT、多模态Agent、多模态Reward model、RL等多模态进阶能力; 4、探索多模态Deep research、Computer Using Agent、Useful Image Generation、理解生成一体模型在抖音交易场景的能力。

更新于 2025-05-20上海
logo of bytedance
社招A103072A

团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、探索大规模和多模态LLM,并将系统优化到其它先进模型(如Gemini, GPT)的水平; 2、多模态预训练、指令微调、人类偏好对齐和模型压缩; 3、落地相关应用,包括视频理解、推荐和代码生成等; 4、深入研究并与全球一流大学的研究人员进行学术合作。

更新于 2024-03-25北京