百度大模型服务技术专家（J90083）

社招全职3年以上ACG2025-07-11地点：北京 | 上海 | 深圳状态：招聘

扫码手机上打开

任职要求

- 本科及以上学历，计算机科学、人工智能、软件工程或相关专业背景
- 3年以上机器学习或深度学习相关工作经验，有实际RAG或Agent应用搭建经验
- 精通Python、Java等至少一种编程语言，熟悉TensorFlow、PyTorch等深度学习框架
- 精…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

- 负责参与ToB项目中大模型技术相关的方案和服务的架构设计、开发与优化、项目落地等工作；
- 深入理解业务需求和行业场景，设计并实施大模型相关技术方案，包括数据、训练、推理服务、智能体应用等；
- 负责建设和沉淀大模型技术相关的通用方案、组件、能力等，提升服务的可复制性和覆盖；
- 参与跟踪和研究大模型领域的最新技术动态，引入新技术以提升服务的质量和效率；

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

机器学习+

深度学习+

RAG+

AI agent+

Python+

还有更多 •••

登录查看完整学习资料

相关职位

通义实验室-云端推理服务技术专家-北京/杭州

社招3年以上技术-基础平台

1. 设计并构建面向多模态交互（语音、视觉、语言、上下文融合）的云端推理服务平台，支持Omni/Speech/VL等大模型的在线/近线推理。 2. 主导端云协同架构中云端服务模块的技术方案，包括模型服务化（Model Serving）、动态批处理（Dynamic Batching）、请求调度、弹性扩缩容、负载均衡等关键能力。 3. 优化云端推理链路的延迟、吞吐与资源利用率，针对ToB客户对SLA（如99.9% 构建统一的服务治理框架，集成监控告警、日志追踪（如OpenTelemetry）、AB测试、灰度发布、故障自愈等运维能力。 4. 与算法团队紧密协作，推动模型结构适配、量化部署、缓存策略等端云联合优化方案落地。

更新于 2026-01-19北京|杭州

阿里云智能-大模型技术服务专家-政企行业- 北京/深圳/杭州/广州

社招2年以上云智能集团

1、负责政企客户的大模型需求收集、分析，设计服务解决方案，通过SOP的把控，端到端的把控项目风险和履约落地。 2、负责政企客户的大模型项目专家技术支持，包括但不限于模型调优、Prompt工程、工作流、RAG、AI agent。 3、负责阿里云 AIStudio、AIWorks等平台的企业级客户的专家服务，持续推动客户做好标准化大模型迁云、云上优化，并根据现场问题持续反馈推进产品改进。 4、深入大模型和客户业务的结合，沉淀孵化大模型服务解决方案，制定服务差异化竞争策略，助力客户在大模型应用上取得成功。

更新于 2025-08-19北京|深圳|杭州

诚云科技-技术服务专家-AI交付

社招5年以上诚云科技

•熟悉金融行业业务，不限于银行，证券，保险，数字金融，能够理解金融业务目标，基于对业务的理解设计AI Agent的业务方案。 •负责金融Agent方案设计和落地实施，包括但不限于业务架构设计、数据处理、智能体搭建、提示词工程、RAG和全链路优化。 •大模型应用开发：基于金融业务需求，设计并实现大模型（如LLM、多模态模型）的调用方案，完成智慧信贷、智能客服、知识问答等场景的核心功能开发； •接口集成与调试：负责大模型API的调用与联调（如千问、ChatGLM、通义千问），编写标准化接口文档，确保模型输出与业务系统的无缝对接； •智能体平台开发：基于主流智能体框架（如LangChain、Rasa、Dify）设计自动化流程，集成多模型协作能力，提升业务场景的智能化水平； •技术文档与赋能：输出模型应用方案、接口规范及智能体平台使用指南，推动团队知识沉淀，并面向客户进行技术培训与支持； •问题排查与优化：针对模型调用异常、数据不一致等问题进行根因分析，提出应用层优化方案并总结典型技术案例； •跨团队协作：与金融客户及合作伙伴紧密沟通，协调资源推进项目进度，确保技术方案符合金融合规要求并实现业务价值。

更新于 2025-12-11西安|成都|北京

【基座模型】-智能体服务技术专家

社招5年以上汽车研发

1. 负责智能体架构体系中的分布式推理服务核心模块设计与开发，构建高吞吐、低延迟的分布式推理系统 2. 研发分布式推理任务调度、负载均衡、容错恢复等关键算法，优化资源利用率与系统稳定性 3. 设计模型并行/流水线并行等分布式推理策略，解决超大规模模型的部署难题 4. 开发分布式推理加速技术（包括计算图优化、分布式KV Cache存储、通信优化等），提升系统性能 5. 实现分布式服务监控与动态扩缩容机制，保障高并发场景下的服务质量

北京