百度多模态大模型算法研发工程师(J96245)
任职要求
-熟悉常见的大语言模型(Llama/Qwen)、多模态大模型(Llava/Qwen-vl)、模型架构(Dense/MOE) -熟悉大模型微调(全参微调/指令微调/PEFT等),了解训练优…
工作职责
-参与智能数据基础设施平台建设,聚焦多模态大模型研发,提升模型在跨模态理解、生成、语义对齐等关键任务上的性能 -参与平台高质量多模态算子开发和高质量工作流构建,支持文档、图片、视频、音频等多种模态数据的高效处理 -参与大语言模型和多模态大模型微调、模型服务搭建、落地项目以及自动化评测体系构建 -参与垂类领域多模态大模型效果优化,从模型结构、训练策略、训练数据等多角度对模型进行优化,打造业界SOTA级模型
1、负责国际化产品机器学习,自然语言处理,大模型算法的开发,LLM Agent的开发,特别是在隐私法律领域的应用,支撑公司相关业务的提效和自动化; 2、设计和实现机器学习,自然语言处理,大模型相关的基础设施、框架、工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习,自然语言处理,大模型相关技术,优化隐私大模型的能力,持续提升平台能力、降低算法使用成本; 4、负责算法模型到API服务的部署,机器学习系统架构设计,工程化落地。
1、探索研发针对大语言模型、多模态大模型、StableDiffusion模型等模型的压缩技术,包括但不限于量化、蒸馏、剪枝、稀疏化等; 2、参与/负责多个业务场景中的模型压缩技术实现,对模型进行轻量化压缩,提高训练/推理效率,支持业务降本增效; 3、参与/负责针对英伟达GPU、华为昇腾NPU等不同的计算硬件,制定不同的模型压缩方案并在业务落地;
深入业务视角,以多模态大数据建模及计算物理仿真为基础,借助AI赋能,帮助半导体工程/工艺/元件特性先行预测与优化,提升工程/工艺/元件研发效率。 工作职责: 1.基于半导体工程/工艺/元件研发需求,开发AI Agent,实现研发流程的自动化与智能化; 2.结合大模型技术(如LLM、多模态大模型等),构建智能化的业务交互与决策系统,提升研发效率; 3.基于产品全生命周期的生产大数据,开发根因查询(RCA)、虚拟量测(VM)、高级工艺控制(APC)、高级机台控制(AEC)等智能化解决方案; 4.开发基于业务驱动的智能工程/工艺/元件设计优化工具,结合物理信息神经网络(PINN)、复杂结构数字孪生、先进材料自动选型等技术,实现研发创新; 5.与半导体研发工程师深入合作,理解业务逻辑,打通数据流,设计并开发能够替代工程师重复操作的AI Agent; 6.探索大模型及AI Agent在半导体研发中的应用场景,推动AI技术与业务需求的深度融合。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、探索研发针对大语言模型、多模态大模型、StableDiffusion模型等模型的压缩技术,包括但不限于量化、蒸馏、剪枝、稀疏化等; 2、参与/负责多个业务场景中的模型压缩技术实现,对模型进行轻量化压缩,提高训练/推理效率,支持业务降本增效; 3、参与/负责针对英伟达GPU、华为昇腾NPU等不同的计算硬件,制定不同的模型压缩方案并在业务落地;