百度AI高级架构研发工程师(J75326)
任职要求
-本科及以上学历,计算机科学、软件工程、通信、数学等相关背景,3年以上架构设计相关经验 -熟练掌握go语言、python、shell等语言,有go开发经验,同时具备c++经验优先 -具备良好的数据结构和算法基础,有较强的架构设计和实现能力,具备数据分析能力 -具备优秀的逻辑思维和分析能力,良好的团队合作精神,沟…
工作职责
-负责新一代 AI 搜索产品的通用架构能力规划与建设落地,牵引AI架构的优化方向,持续构建AI竞争力 -分析关键的AI应用场景,发现技术瓶颈,提出架构优化建议 -负责 AI 各种子系统设计,比如memory系统设计、模型流控、风控设计、智能体分发协议设计等 -负责 AI 搜索服务运维、系统级架构优化和治理 ,提出建设性意见,提升服务性能和稳定性建设 -负责AI能力统一输出及转化为能够赋能提效的终端产品研发 -负责对接涉及多团队协作项目的工作分解和实现等其他工作
1.负责数据万象产品中 MetaInsight系统的 AI 及大模型算法模型的研发工作,包括但不限于模型设计、训练、优化和评估,提升模型的性能和准确性; 2.参与大模型的推理服务框架开发,和后端应用开发团队协力解决自然语言处理、计算机视觉等实际业务需求中的复杂问题; 3.负责多模态检索算法的研发和优化,提高检索精度和效率;参与检索系统的框架设计和模块开发,打造有竞争力的媒资检索产品; 4.跟踪大模型和信息检索领域的最新研究进展,引入前沿技术和理念,推动团队技术的不断创新; 5.与团队成员紧密合作,进行技术攻关和代码优化,不断提升算法精度和系统性能。
作为具身智能开放平台团队的核心成员,参与具身智能的核心组件、服务框架和生态平台的研发工作,帮助开发者高效地利用具身大模型能力,实现机器人应用的快速落地,您将参与如下工作: 1.平台核心架构研发: 参与具身智能开放平台 后端服务 的设计、开发和维护,包括高并发、低延迟的 API 网关、任务调度系统和云边协同架构。 2.AI与具身集成: 设计和实现 大模型(LLM/VLM)与机器人控制系统 之间的通信接口和数据转换服务,确保高级语义指令(如自然语言)能稳定、高效地转化为机器人可执行的动作序列。 3.开发者生态工具: 负责开发和优化平台 SDK、API 接口和后台管理系统,为全球机器人开发者提供友好、强大的工具和服务。 4.数据与存储服务: 构建和维护机器人感知数据、行为数据和模型训练数据的存储、索引及检索服务,确保数据的高可靠性和高吞吐量。 5.性能优化与稳定性: 负责解决系统瓶颈,进行代码重构和性能调优,确保平台在数千台甚至数万台机器人并发连接下的高可用性和稳定性。
工作职责: 1、负责大模型平台的架构设计和核心功能研发,构建云原生架构,设计高可用、高性能的微服务体系; 2、负责构建面向大模型全流程的DevOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地; 3、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、GPU虚拟化、存储&网络加速等手段,提升GPU集群使用效率; 4、将平台和框架结合,通过任务调度、弹性容灾、性能优化等措施端到端提升AI生产效率,涉及k8s/kubeflow、网络通信、分布式训练等; 5、优化各AI平台性能,提升系统稳定性和可扩展性,保障大规模并发场景下的服务质量与用户体验; 6、持续研究分析业内创新AI平台产品,优化技术方案,改进产品功能,提升创新能力与产品体验。