百度大模型服务技术专家(J90083)
任职要求
- 本科及以上学历,计算机科学、人工智能、软件工程或相关专业背景 - 3年以上机器学习或深度学习相关工作经验,有实际RAG或Agent应用搭建经验 - 精通Python、Java等至少一种编程语言,熟悉TensorFlow、PyTorch等深度学习框架 - 精通提示工程(Prompt Engineering)技术和最佳实践,了解大模型Agent架构设计和实现技术 - 了解DeepSeek-R1等先进大模型的特性及其在Agent构建中的优势 - 具备良好的问题解决能力、团队合作精神和沟通能力,能够独立承担项目并推动实施
工作职责
- 负责参与ToB项目中大模型技术相关的方案和服务的架构设计、开发与优化、项目落地等工作; - 深入理解业务需求和行业场景,设计并实施大模型相关技术方案,包括数据、训练、推理服务、智能体应用等; - 负责建设和沉淀大模型技术相关的通用方案、组件、能力等,提升服务的可复制性和覆盖; - 参与跟踪和研究大模型领域的最新技术动态,引入新技术以提升服务的质量和效率;
1、负责政企客户的大模型需求收集、分析,设计服务解决方案,通过SOP的把控,端到端的把控项目风险和履约落地。 2、负责政企客户的大模型项目专家技术支持,包括但不限于模型调优、Prompt工程、工作流、RAG、AI agent。 3、负责阿里云 AIStudio、AIWorks等平台的企业级客户的专家服务,持续推动客户做好标准化大模型迁云、云上优化,并根据现场问题持续反馈推进产品改进。 4、深入大模型和客户业务的结合,沉淀孵化大模型服务解决方案,制定服务差异化竞争策略,助力客户在大模型应用上取得成功。
1. 负责智能体架构体系中的分布式推理服务核心模块设计与开发,构建高吞吐、低延迟的分布式推理系统 2. 研发分布式推理任务调度、负载均衡、容错恢复等关键算法,优化资源利用率与系统稳定性 3. 设计模型并行/流水线并行等分布式推理策略,解决超大规模模型的部署难题 4. 开发分布式推理加速技术(包括计算图优化、分布式KV Cache存储、通信优化等),提升系统性能 5. 实现分布式服务监控与动态扩缩容机制,保障高并发场景下的服务质量
1.基于业界主流大模型及相关平台能力,结合支付宝拥有的丰富且体系化的服务生态,打造国内领先的智能服务平台; 2.深入研究大模型原理,结合大模型的Agent应用范式,支持支付宝核心场景大模型服务升级。
1、重点围绕汽车行业领域的AI场景,基于对业务场景需求的挖掘和理解,提供全栈的AI大模型技术服务,实现AI大模型在汽车行业领域的价值落地,服务内容包括AI算力训推性能优化服务、智驾/智舱模型后训练服务、汽车AI场景后训练服务、应用场景Agent优化落地等。 2、负责针对汽车行业构建AI大模型全栈技术服务体系,围绕AI算力、AI平台、AI大模型后训练、应用Agent方案落地等服务内容建设标准化服务能力与服务工具,推进AI服务方案在汽车行业的规模化落地。 3、负责跟踪与研究业界前沿AI技术,探索与推动AI前沿技术在汽车行业领域实际场景的快速应用与落地,协同团队推动行业客户在用云用AI的服务保障、云上业务治理不断优化。