logo of tuhu

途虎养车大模型开发工程师

社招全职技术地点:上海状态:招聘

任职要求


1.计算机科学、人工智能等相关专业本科及以上学历。
2.精通Python,有sglang/vllm等开源推理引擎二次开发经验优先。
3.熟悉DeepSeek、GPT等主流大模型架构与训练推理流程,具备模型部署、性能调优及问题定位经验。
4.熟练使用Kubernetes、Docker等容器化技术,具备…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责主流及自研模型(如Qwen、DeepSeek、MiniMax等)的全链路运维,涵盖部署、监控、高可用保障与故障应急处理,构建可观测体系(日志/指标),确保模型服务稳定性与低延迟响应。
2.优化基于Docker/Kubernetes的模型部署与资源调度策略,提升GPU/CPU资源利用率,推动模型平滑升级与业务无损切换。
3.主导大模型运维平台建设,集成模型监控、评测、用量分析、成本分摊、批量推理及数据集管理等核心能力,提升运维自动化与智能化水平。
4.结合业务实际部署场景,基于sglang/vllm等开源推理引擎进行模型适配部署或二次开发
5.协同算法/业务团队,推动模型从实验到生产的全流程落地,持续跟进大模型与AIOps前沿技术,探索智能运维创新场景。
包括英文材料
学历+
Python+
SGLang+
vLLM+
推理引擎+
GPT+
还有更多 •••
相关职位

logo of didi
社招3年以上技术

1、负责大语言模型应用研发(包括 C 端及B端产品),保障项目开发质量和效率; 2、跟进业界技术发展动态,探索和快速落地产品应用; 3、在系统产品探索和落地过程中,沉淀大模型应用方法/框架。

更新于 2025-04-10北京
logo of antgroup
社招技术类-开发

1、参与蚂蚁全球大模型平台的设计与开发,支撑大模型的研发训练以及在业务场景的应用落地。 2、独立承接项目需求,负责业务需求分析、系统核心方案设计和代码编写。 3、跟进业界大模型与生成式人工智能进展,参与相关的工程能力建设。 4、负责线上系统的维护和管理,能线上问题快速定位和优化,保障系统稳定运行。

更新于 2025-04-17上海|杭州
logo of antgroup
社招技术类-开发

1、参与蚂蚁全球大模型平台的设计与开发,支撑大模型的研发训练以及在业务场景的应用落地。 2、独立承接项目需求,负责业务需求分析、系统核心方案设计和代码编写。 3、跟进业界大模型与生成式人工智能进展,参与相关的工程能力建设。 4、负责线上系统的维护和管理,能线上问题快速定位和优化,保障系统稳定运行。

更新于 2025-04-17上海|杭州
logo of aliyun
社招3年以上诚云科技

1. 参与大模型应用相关智能产品及创新方向的技术方案设计、研发及发布 2. 参与到项目中为客户提供技术支持,并将问题转化为可产品化的解决方案 3. 紧跟大模型技术发展趋势,参与团队技术分享,将好的技术及解决方案应用到产品中

更新于 2026-01-07北京|杭州