百度2027AIDU-语音大模型算法工程师(J99954)
任职要求
1. 具备机器学习/深度学习/自然语言处理/语音处理/计算机视觉的理论背景和实践经验; 2. 熟练掌握Python编程语言以及Pytorch、Tensorflow、PaddlePaddle等其中一项深度学习开发框架; 3. 具有较好的团队沟通合作能力、分析…
工作职责
1. 研究跨模态数据表征方法、高质量数据萃取方法、高效算法算力融合的创新算法,探索跨模态端到端大模型的前瞻技术和趋势; 2. 支持大模型平台化及规模化创新应用落地。
1. 负责多模态大模型的算法研发与迭代,覆盖图文、视频、语音、3D等多模态融合理解与生成; 2. 研究跨模态对齐、对比学习、扩散模型、视频生成、图像编辑、3D生成、风格迁移等前沿技术; 3. 参与多模态数据pipeline建设、评测体系设计与业务落地,推动模型在搜索、推荐、AIGC、健康、自动驾驶、网盘文库、视频理解、解题等核心场景中的应用; 4. 研发方向包括但不限于:视觉感知算法、多模态理解模型、图像/视频生成、模型压缩轻量化、文档多模态等; 5. 建设多模态数据管线,优化模型训练与推理效率,完成算法模型的训练、优化和部署。
我们致力于构建全球领先的AI异构计算加速引擎和加速平台。建立融合推理(Inference)、训练(Training)的软硬件一体的AI计算加速解决方案,并应用于行业最大的规模的AI数据中心,解决云计算、搜索、信息流、图像、视觉、语音、自然语言处理等的算法优化与计算加速问题。 1. 负责大规模AI前向计算引擎(Inference Engine)框架和底层算子开发与优化; 2. 负责大规模AI计算通信库及通信算法开发与优化; 3. 负责面向CPU/GPU/FPGA/ASIC等多元化计算架构的编译系统开发、编译优化和算法加速; 4. 负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化。
1. 负责大模型(LLM)的核心算法研发,包括预训练、指令微调(SFT)、RLHF、对齐优化、推理增强等; 2. 探索高效的模型调优策略、高质量数据建设方法,研究MoE稀疏化、Latent Attention等前沿模型结构; 3. 支持大模型在搜索、推荐、对话、AIGC、语音、网盘文库、出海等多元业务场景的应用落地与效果优化; 4. 设计、实现并优化大规模分布式训练与推理框架,提升训练稳定性和推理效率; 5. 参与大模型平台化建设,推动模型能力向创新产品转化。