百度AI高级架构研发工程师(J75326)
任职要求
-本科及以上学历,计算机科学、软件工程、通信、数学等相关背景,3年以上架构设计相关经验 -熟练掌握go语言、python、shell等语言,有go开发经验,同时具备c++经验优先 -具备良好的数据结构和算法基础,有较强的架构设计和实现能力,具备数据分析能力 -具备优秀的逻辑思维和分析能力,良好的团队合作精神,沟…
工作职责
-负责新一代 AI 搜索产品的通用架构能力规划与建设落地,牵引AI架构的优化方向,持续构建AI竞争力 -分析关键的AI应用场景,发现技术瓶颈,提出架构优化建议 -负责 AI 各种子系统设计,比如memory系统设计、模型流控、风控设计、智能体分发协议设计等 -负责 AI 搜索服务运维、系统级架构优化和治理 ,提出建设性意见,提升服务性能和稳定性建设 -负责AI能力统一输出及转化为能够赋能提效的终端产品研发 -负责对接涉及多团队协作项目的工作分解和实现等其他工作
1.负责数据万象产品中 MetaInsight系统的 AI 及大模型算法模型的研发工作,包括但不限于模型设计、训练、优化和评估,提升模型的性能和准确性; 2.参与大模型的推理服务框架开发,和后端应用开发团队协力解决自然语言处理、计算机视觉等实际业务需求中的复杂问题; 3.负责多模态检索算法的研发和优化,提高检索精度和效率;参与检索系统的框架设计和模块开发,打造有竞争力的媒资检索产品; 4.跟踪大模型和信息检索领域的最新研究进展,引入前沿技术和理念,推动团队技术的不断创新; 5.与团队成员紧密合作,进行技术攻关和代码优化,不断提升算法精度和系统性能。
工作职责: 1、负责大模型平台的架构设计和核心功能研发,构建云原生架构,设计高可用、高性能的微服务体系; 2、负责构建面向大模型全流程的DevOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地; 3、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、GPU虚拟化、存储&网络加速等手段,提升GPU集群使用效率; 4、将平台和框架结合,通过任务调度、弹性容灾、性能优化等措施端到端提升AI生产效率,涉及k8s/kubeflow、网络通信、分布式训练等; 5、优化各AI平台性能,提升系统稳定性和可扩展性,保障大规模并发场景下的服务质量与用户体验; 6、持续研究分析业内创新AI平台产品,优化技术方案,改进产品功能,提升创新能力与产品体验。
1、负责模型训练平台核心功能开发和架构设计,包括传统CN/NLP/SD/LLM等多场景支持 2、负责大模型后训练工具平台化建设,包括后预训练、微调、对齐等技术落地 3、设计和实现高性能分布式训练系统,打造端到端训练解决方案 4、优化训练调度和资源管理,提升集群利用率和训练效率 5、开发模型训练监控诊断工具,建设可观测性体系