logo of tencent

腾讯AI 推理平台研发工程师

社招全职3年以上边缘平台及CDN流量类技术地点:深圳状态:招聘

任职要求


1.扎实的编程能力,熟悉后端开发语言(PythonGolangJavaC++中一种);
2.熟悉后端架构与云原生技术,具备高并发分布式系统开发经验;
3.熟悉主流 AI 开发技术栈(如 PyTorch、OpenAI SDK、Hugging Face),具备模型服务化部署经验;
4.有 AI 推理在工业上大规模落地的经验,熟悉 AI 模型从资源建设到上线对外过程中常见的问题和解决方案;
5.具备优秀的学习能力、创新能力、沟通能力、团队合作意识;强烈的责任心与主动性,并能自我驱动成长,能承受一定强度的工作压力。

工作职责


1.建设一站式的 AI 推理平台,链接模型训练、部署编排到应用分发整个过程;
2.通过部署编排、资源调度、模型优化等手段,优化推理成本,提供极致低成本的推理平台;
3.负责 AI 推理产品后端架构设计,参与需求分析、功能实现与性能优化,支持高并发、大数据场景下的稳定运行;
4.关注 AI 与大模型领域技术发展趋势,并灵活应用于项目中。
包括英文材料
后端开发+
Python+
Go+
Java+
C+++
高并发+
分布式系统+
PyTorch+
SDK+
相关职位

logo of baidu
社招3年以上ACG

-参与百度千帆大模型平台推理服务相关系统的设计与研发 -参与建设基于云计算基础架构的高可扩展、高性能服务平台 -负责大模型平台相关系统的维护和升级,进行性能优化、稳定性建设,提升资源利用率 -参与大模型相关前沿技术调研和创新能力落地

更新于 2024-06-26
logo of xiaohongshu
社招3年以上机器学习平台

1、负责AI平台推理部署核心功能开发,包括服务管理、部署、发布等模块 2、设计并实现推理服务的自动化运维体系,包括监控、告警和运维工具 3、开发服务编排和调度系统,实现资源的高效分配和负载均衡 4、构建平台运维API和SDK,提供完整的服务生命周期管理能力 5、优化平台整体架构,提升系统可用性、扩展性和性能

logo of xiaohongshu
社招引擎

1、参与/负责研发面向大规模稀疏参数机器学习模型的等推理服务框架; 2、通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架; 3、与全公司各业务算法部门深度合作,为重点项目进行算法与系统的联合优化,支撑业务目标达成; 4、深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、推荐系统等;

更新于 2025-07-24
logo of dewu
社招3年以上技术类

我们是得物机器学习平台团队,负责构建面向搜索推荐场景的一站式深度学习平台。你将参与机器学习平台的研发工作。 专注于每日数百亿PV请求的在线高可靠、高并发的CPU/GPU异构推理计算框架和通用的特征平台建设;

更新于 2023-12-26