百度大模型服务技术专家(J90083)
任职要求
- 本科及以上学历,计算机科学、人工智能、软件工程或相关专业背景 - 3年以上机器学习或深度学习相关工作经验,有实际RAG或Agent应用搭建经验 - 精通Python、Java等至少一种编程语言,熟悉TensorFlow、PyTorch等深度学习框架 - 精…
工作职责
- 负责参与ToB项目中大模型技术相关的方案和服务的架构设计、开发与优化、项目落地等工作; - 深入理解业务需求和行业场景,设计并实施大模型相关技术方案,包括数据、训练、推理服务、智能体应用等; - 负责建设和沉淀大模型技术相关的通用方案、组件、能力等,提升服务的可复制性和覆盖; - 参与跟踪和研究大模型领域的最新技术动态,引入新技术以提升服务的质量和效率;
1. 设计并构建面向多模态交互(语音、视觉、语言、上下文融合)的云端推理服务平台,支持Omni/Speech/VL等大模型的在线/近线推理。 2. 主导端云协同架构中云端服务模块的技术方案,包括模型服务化(Model Serving)、动态批处理(Dynamic Batching)、请求调度、弹性扩缩容、负载均衡等关键能力。 3. 优化云端推理链路的延迟、吞吐与资源利用率,针对ToB客户对SLA(如99.9% 构建统一的服务治理框架,集成监控告警、日志追踪(如OpenTelemetry)、AB测试、灰度发布、故障自愈等运维能力。 4. 与算法团队紧密协作,推动模型结构适配、量化部署、缓存策略等端云联合优化方案落地。
1、负责政企客户的大模型需求收集、分析,设计服务解决方案,通过SOP的把控,端到端的把控项目风险和履约落地。 2、负责政企客户的大模型项目专家技术支持,包括但不限于模型调优、Prompt工程、工作流、RAG、AI agent。 3、负责阿里云 AIStudio、AIWorks等平台的企业级客户的专家服务,持续推动客户做好标准化大模型迁云、云上优化,并根据现场问题持续反馈推进产品改进。 4、深入大模型和客户业务的结合,沉淀孵化大模型服务解决方案,制定服务差异化竞争策略,助力客户在大模型应用上取得成功。
•熟悉金融行业业务,不限于银行,证券,保险,数字金融,能够理解金融业务目标,基于对业务的理解设计AI Agent的业务方案。 •负责金融Agent方案设计和落地实施,包括但不限于业务架构设计、数据处理、智能体搭建、提示词工程、RAG和全链路优化。 •大模型应用开发:基于金融业务需求,设计并实现大模型(如LLM、多模态模型)的调用方案,完成智慧信贷、智能客服、知识问答等场景的核心功能开发; •接口集成与调试:负责大模型API的调用与联调(如千问、ChatGLM、通义千问),编写标准化接口文档,确保模型输出与业务系统的无缝对接; •智能体平台开发:基于主流智能体框架(如LangChain、Rasa、Dify)设计自动化流程,集成多模型协作能力,提升业务场景的智能化水平; •技术文档与赋能:输出模型应用方案、接口规范及智能体平台使用指南,推动团队知识沉淀,并面向客户进行技术培训与支持; •问题排查与优化:针对模型调用异常、数据不一致等问题进行根因分析,提出应用层优化方案并总结典型技术案例; •跨团队协作:与金融客户及合作伙伴紧密沟通,协调资源推进项目进度,确保技术方案符合金融合规要求并实现业务价值。