腾讯混元一站式平台开发工程师(深圳/北京)
社招全职2年以上公共技术地点:深圳状态:招聘
任职要求
1.熟练掌握Pytorch、Megatron、veRL等主流深度学习框架中的一种或多种,并有具体的项目应用经验(包括但不限于模型训练优化、模型服务优化等经验); 2.熟练…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责腾讯混元机器学习平台的设计与开发,包括:性能优化,持续提升训练性能,包括多机多卡大规模训练优化,数据交换优化等; 2.深入理解跟踪业界AIGC动态,优化平台技术方案,提升平台易用性,降低大模型研发门槛,不断推进平台的LLMOps能力升级; 3.积极追踪业内AI动态,优化内部技术方案,改进产品性能,不断推进AI架构升级。
包括英文材料
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
Megatron+
https://www.youtube.com/watch?v=hc0u4avAkuM
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
还有更多 •••
相关职位
社招3年以上TEG产品
1.通过对广泛业务中用户行为和反馈的研究,确定自研LLM的改进空间、优先级,以及相应的改进手段; 2.与业务团队合作,将混元模型能力整合到产品及服务中; 3.对齐数据采集和生产的方法,确保数据质量保持在高标准,并根据定量和定性反馈不断改进流程,有一到两个行业的专有数据经验优先。
更新于 2025-06-20深圳
社招3年以上AI技术
1.负责TTS、ASR、声学前处理、自然语言处理、多模态大模型等AI系统的工程开发(包括训练工具和推理引擎的开发、优化、交付等); 2.负责AI系统最新算法的集成、工程化、实际场景效果验证、优化、上线; 3.负责AI相关业务、产品的工程支持,在效果和性能上更好的落地。
更新于 2025-09-12深圳
社招3年以上TEG技术
1.负责混元大模型相关研发工作,包括文本创作、文本理解、数学、翻译、Agent FunctionCalls等专项; 2.负责混元在公司内相关业务场景落地,根据业务需求优化混元模型,提升业务效果; 3.负责跟踪和探索大语言模型的前沿问题,结合实际场景,提供全面的技术解决方案,参与前沿算法与应用的研究。
更新于 2025-06-19北京