logo of tencent

腾讯AI 推理平台研发工程师

社招全职3年以上边缘平台及CDN流量类技术地点:深圳状态:招聘

任职要求


1.扎实的编程能力,熟悉后端开发语言(PythonGolangJavaC++中一种);
2.熟悉后端架构与云原生技术,具备高并发、分布式系统开发经验;
3.熟悉主流 AI 开发技术栈(如 PyTorch、OpenAI SDK、Hugging Face),…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.建设一站式的 AI 推理平台,链接模型训练、部署编排到应用分发整个过程;
2.通过部署编排、资源调度、模型优化等手段,优化推理成本,提供极致低成本的推理平台;
3.负责 AI 推理产品后端架构设计,参与需求分析、功能实现与性能优化,支持高并发、大数据场景下的稳定运行;
4.关注 AI 与大模型领域技术发展趋势,并灵活应用于项目中。
包括英文材料
后端开发+
Python+
Go+
Java+
还有更多 •••
相关职位

logo of mihoyo
社招3-5年程序&技术类

岗位职责: 1. 负责大模型推理平台的开发、维护与性能优化,保障服务高可用性和高性能运行 2. 对大模型 KVCache 集群进行开发、维护与性能调优,解决大规模并发推理内存瓶颈 3. 管理推理服务的计算资源、流量及任务调度,优化集群资源利用率,降低推理成本 4. 建立推理服务监控告警体系,及时发现和解决性能异常和系统故障 5. 参与推理服务架构设计,支持多模态模型和不同规模模型的推理需求

上海|北京
logo of baidu
社招3年以上ACG

-参与百度千帆大模型平台推理服务相关系统的设计与研发 -参与建设基于云计算基础架构的高可扩展、高性能服务平台 -负责大模型平台相关系统的维护和升级,进行性能优化、稳定性建设,提升资源利用率 -参与大模型相关前沿技术调研和创新能力落地

更新于 2024-06-26北京|上海
logo of xiaohongshu
社招3年以上机器学习平台

1、负责AI平台推理部署核心功能开发,包括服务管理、部署、发布等模块 2、设计并实现推理服务的自动化运维体系,包括监控、告警和运维工具 3、开发服务编排和调度系统,实现资源的高效分配和负载均衡 4、构建平台运维API和SDK,提供完整的服务生命周期管理能力 5、优化平台整体架构,提升系统可用性、扩展性和性能

北京|上海|深圳
logo of xiaohongshu
社招3-5年引擎

1、参与/负责研发面向大规模稀疏参数机器学习模型的等推理服务框架; 2、通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架; 3、与全公司各业务算法部门深度合作,为重点项目进行算法与系统的联合优化,支撑业务目标达成; 4、深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、推荐系统等;

更新于 2025-10-22上海|深圳