顺丰大模型基础架构研发工程师
社招全职5-10年地点:深圳状态:招聘
任职要求
1. 教育背景:
* 计算机科学、软件工程、人工智能等相关专业本科及以上学历。
2. 工作经验:
* 3年以上分布式系统、基础架构研发或大规模深度学习系统开发经验,具备扎实的系统设计和优化能力。
3. 技术能力:
* 熟悉大模型基础架构,包括大规模训练、推理的计算资源调度和优化策略。
* 熟悉主流大模型推理框架(如vLLM、TensorRT、ONNX Runtime、DeepSpeed、Triton等),能够根据需求进行定制化优化。
* 具有分布式系统开发经验,能独立设计和优化分布式计算框架,具备负载均衡、容错等系统调优能力。
* 深刻理解大模型推理中的性能瓶颈,能够使用各种技术手段(如模型压缩、量化、并行化等)提升推理性能。
4. 编程能力:
* 精通Python、C++等编程语言,具备…登录查看完整任职要求
微信扫码,1秒登录
工作职责
岗位职责:
1. 大模型基础架构设计与研发:
* 负责大模型基础架构的设计、研发和优化,包括模型训练、推理过程中的高效计算资源调度、内存优化、网络传输优化等。
* 参与大模型推理服务的搭建与部署,确保系统的高可用性、高性能和可扩展性。
2. 推理优化与性能提升:
* 负责大模型推理过程中的性能优化,优化模型推理速度、内存消耗和计算资源使用。
* 根据不同的应用场景,优化推理算法和模型压缩技术,实现低延迟和高吞吐量的推理服务。
3. 主流推理框架的应用与定制:
* 熟悉并使用主流的大模型推理框架(如TensorRT、ONNX Runtime、DeepSpeed等),并能够根据需求进行定制化开发与优化。
* 结合实际业务需求,灵活调整推理框架的配置和参数,提升整体推理效率。
4. 分布式系统开发与优化:
* 设计并实现大模型推理在分布式系统中的高效调度与协同工作,确保大规模并发请求的处理能力。
* 优化分布式系统的通信、负载均衡、容错能力等,提升系统的整体稳定性和性能。
5. 系统调优与故障排查:
* 定期进行系统性能评估和瓶颈分析,提出系统优化方案并实施。
* 能够快速定位和解决系统性能瓶颈和推理过程中的各类问题,确保系统高效、稳定运行。
6. 技术创新与团队协作:
* 跟踪大模型基础架构领域的最新研究与技术进展,提出创新性的技术方案。
* 与团队成员密切合作,共同推动技术解决方案的实施与落地。包括英文材料
学历+
分布式系统+
https://www.distributedsystemscourse.com/
The home page of a free online class in distributed systems.
https://www.youtube.com/watch?v=7VbL89mKK3M&list=PLOE1GTZ5ouRPbpTnrZ3Wqjamfwn_Q5Y9A
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
vLLM+
https://www.newline.co/@zaoyang/ultimate-guide-to-vllm--aad8b65d
vLLM is a framework designed to make large language models faster, more efficient, and better suited for production environments.
https://www.youtube.com/watch?v=Ju2FrqIrdx0
vLLM is a cutting-edge serving engine designed for large language models (LLMs), offering unparalleled performance and efficiency for AI-driven applications.
TensorRT+
https://docs.nvidia.com/deeplearning/tensorrt/latest/getting-started/quick-start-guide.html
This TensorRT Quick Start Guide is a starting point for developers who want to try out the TensorRT SDK; specifically, it demonstrates how to quickly construct an application to run inference on a TensorRT engine.
ONNX+
https://github.com/onnx/tutorials
Open Neural Network Exchange (ONNX) is an open standard format for representing machine learning models.
[英文] Introduction to ONNX
https://onnx.ai/onnx/intro/
This documentation describes the ONNX concepts (Open Neural Network Exchange).
还有更多 •••
相关职位
校招AIDU项目
-负责模型优化工程架构研发工作,涵盖预估架构、特征工程、模型训练、推理优化等; -优化模型核心推理/训练性能,负责自研推理&训练框架的演进迭代; -优化在线的高并发高可用服务架构以及离线的高负载大数据量的服务架构; -和团队一起攻克高性能、高并发、高可用性等各种不同技术场景下的技术挑战。
更新于 2025-05-19北京
社招5年以上后端开发
1、负责小红书录制回放平台的核心架构设计、研发发和优化,实现大规模流量录制、存储、回放及降噪。 2、深入理录制回放原理,实现社区、搜广推、电商等业务场景下在日常迭代及系统重构的回放测试解决方案与业务支持。 3、主导关键技术攻坚,解决高并发流量录制/回放中的技术难题(如数据一致性、协议解析、性能瓶颈优化等)。 4、与测试团队、研发团队紧密协作,推动平台与CI/CD流程集成,实现自动化测试与持续验证能力。
北京|上海|杭州

社招实习类
职位介绍加入我们,你将会参与由第四范式自主研发的多模态大模型基础架构研发工作,和经验丰富的工程师以及科学家一起,参与到业界领先的多模态大模型训练任务中。主要工作内容包括但不限于: • 探索基于云原生的分布式多模态大模型训练任务调度方案,在GPU虚拟化,训练任务的拓扑优化方向找寻新的可能性 • 探索基于云原生的分布式多模态大模型训练的的网络和存储解决方案,优化整体集群的网络和存储效率
更新于 2023-05-30北京
