腾讯微信-基础大模型训练框架高级研发工程师
社招全职WXG技术地点:深圳状态:招聘
任职要求
1.熟练使用PyTorch框架,可对DDP训练的代码进行性能分析和优化; 2.熟练使用主流大模型训练框架DeepSpeed、Megatron,掌握3D并行、ZeRO机制、Flash-Attn等的原理、使用场景、优劣势以及可优化方向; 3.熟练…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.参与开发优化大模型训练框架,支持大规模高效稳定训练; 2.参与大模型结构设计,并联合业务进行模型训练效率和效果验证。
包括英文材料
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
还有更多 •••
相关职位
社招3年以上机器学习平台
【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性
北京|上海|深圳
社招3年以上经纪业务研发部
1、负责贝壳C端的后端服务设计与开发,保障高并发场景下的系统稳定性; 2、能够理解和分析产品需求,给出合理的技术方案和开发计划; 3、关注性能、微服务、设计模式,提升用户体验
更新于 2025-04-02北京
社招旅游业务开发
用车用户订单业务线产品需求分析与评审,提出有建设性的技术解决方案,帮助业务实现业绩目标; 负责订单支付、状态流转、快照等域的业务开发和维护; 根据所负责的需求进行技术方案设计,文档输出,并进行代码的编写、优化及单元测试;
更新于 2025-03-31上海