logo of baidu

百度大模型服务技术专家(J90083)

社招全职3年以上ACG地点:北京 | 上海 | 深圳状态:招聘

任职要求


- 本科及以上学历,计算机科学、人工智能、软件工程或相关专业背景
- 3年以上机器学习深度学习相关工作经验,有实际RAGAgent应用搭建经验
- 精通Python、Java等至少一种编程语言,熟悉TensorFlow、PyTorch等深度学习框架
- 精…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


- 负责参与ToB项目中大模型技术相关的方案和服务的架构设计、开发与优化、项目落地等工作;
- 深入理解业务需求和行业场景,设计并实施大模型相关技术方案,包括数据、训练、推理服务、智能体应用等;
- 负责建设和沉淀大模型技术相关的通用方案、组件、能力等,提升服务的可复制性和覆盖;
- 参与跟踪和研究大模型领域的最新技术动态,引入新技术以提升服务的质量和效率;
包括英文材料
学历+
机器学习+
深度学习+
RAG+
AI agent+
Python+
还有更多 •••
相关职位

logo of tongyi
社招3年以上技术类-开发

1. 设计并构建面向多模态交互(语音、视觉、语言、上下文融合)的云端推理服务平台,支持Omni/Speech/VL等大模型的在线/近线推理。 2. 主导端云协同架构中云端服务模块的技术方案,包括模型服务化(Model Serving)、动态批处理(Dynamic Batching)、请求调度、弹性扩缩容、负载均衡等关键能力。 3. 优化云端推理链路的延迟、吞吐与资源利用率,针对ToB客户对SLA(如99.9% 构建统一的服务治理框架,集成监控告警、日志追踪(如OpenTelemetry)、AB测试、灰度发布、故障自愈等运维能力。 4. 与算法团队紧密协作,推动模型结构适配、量化部署、缓存策略等端云联合优化方案落地。

更新于 2025-11-22北京|杭州
logo of aliyun
社招2年以上云智能集团

1、负责政企客户的大模型需求收集、分析,设计服务解决方案,通过SOP的把控,端到端的把控项目风险和履约落地。 2、负责政企客户的大模型项目专家技术支持,包括但不限于模型调优、Prompt工程、工作流、RAG、AI agent。 3、负责阿里云 AIStudio、AIWorks等平台的企业级客户的专家服务,持续推动客户做好标准化大模型迁云、云上优化,并根据现场问题持续反馈推进产品改进。 4、深入大模型和客户业务的结合,沉淀孵化大模型服务解决方案,制定服务差异化竞争策略,助力客户在大模型应用上取得成功。

更新于 2025-08-19北京|深圳|杭州
logo of aliyun
社招5年以上诚云科技

•熟悉金融行业业务,不限于银行,证券,保险,数字金融,能够理解金融业务目标,基于对业务的理解设计AI Agent的业务方案。 •负责金融Agent方案设计和落地实施,包括但不限于业务架构设计、数据处理、智能体搭建、提示词工程、RAG和全链路优化。 •大模型应用开发:基于金融业务需求,设计并实现大模型(如LLM、多模态模型)的调用方案,完成智慧信贷、智能客服、知识问答等场景的核心功能开发; •接口集成与调试:负责大模型API的调用与联调(如千问、ChatGLM、通义千问),编写标准化接口文档,确保模型输出与业务系统的无缝对接; •智能体平台开发:基于主流智能体框架(如LangChain、Rasa、Dify)设计自动化流程,集成多模型协作能力,提升业务场景的智能化水平; •技术文档与赋能:输出模型应用方案、接口规范及智能体平台使用指南,推动团队知识沉淀,并面向客户进行技术培训与支持; •问题排查与优化:针对模型调用异常、数据不一致等问题进行根因分析,提出应用层优化方案并总结典型技术案例; •跨团队协作:与金融客户及合作伙伴紧密沟通,协调资源推进项目进度,确保技术方案符合金融合规要求并实现业务价值。

更新于 2025-12-04西安|成都|北京
logo of liauto
社招5年以上汽车研发

1. 负责智能体架构体系中的分布式推理服务核心模块设计与开发,构建高吞吐、低延迟的分布式推理系统 2. 研发分布式推理任务调度、负载均衡、容错恢复等关键算法,优化资源利用率与系统稳定性 3. 设计模型并行/流水线并行等分布式推理策略,解决超大规模模型的部署难题 4. 开发分布式推理加速技术(包括计算图优化、分布式KV Cache存储、通信优化等),提升系统性能 5. 实现分布式服务监控与动态扩缩容机制,保障高并发场景下的服务质量

北京