logo of baidu

百度多模态大模型算法研发工程师(J96245)

社招全职ACG地点:北京状态:招聘

任职要求


-熟悉常见的大语言模型(Llama/Qwen)、多模态大模型(Llava/Qwen-vl)、模型架构(Dense/MOE)
-熟悉大模型微调(全参微调/指令微调/PEFT等),了解训练优…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


-参与智能数据基础设施平台建设,聚焦多模态大模型研发,提升模型在跨模态理解、生成、语义对齐等关键任务上的性能
-参与平台高质量多模态算子开发和高质量工作流构建,支持文档、图片、视频、音频等多种模态数据的高效处理
-参与大语言模型和多模态大模型微调、模型服务搭建、落地项目以及自动化评测体系构建
-参与垂类领域多模态大模型效果优化,从模型结构、训练策略、训练数据等多角度对模型进行优化,打造业界SOTA级模型
包括英文材料
Llama+
大模型+
相关职位

logo of bytedance
社招3年以上A50442A

1、负责国际化产品机器学习,自然语言处理,大模型算法的开发,LLM Agent的开发,特别是在隐私法律领域的应用,支撑公司相关业务的提效和自动化; 2、设计和实现机器学习,自然语言处理,大模型相关的基础设施、框架、工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习,自然语言处理,大模型相关技术,优化隐私大模型的能力,持续提升平台能力、降低算法使用成本; 4、负责算法模型到API服务的部署,机器学习系统架构设计,工程化落地。

更新于 2025-04-21上海
logo of xiaohongshu
社招5-10年引擎

1、探索研发针对大语言模型、多模态大模型、StableDiffusion模型等模型的压缩技术,包括但不限于量化、蒸馏、剪枝、稀疏化等; 2、参与/负责多个业务场景中的模型压缩技术实现,对模型进行轻量化压缩,提高训练/推理效率,支持业务降本增效; 3、参与/负责针对英伟达GPU、华为昇腾NPU等不同的计算硬件,制定不同的模型压缩方案并在业务落地;

更新于 2025-08-05北京|上海
logo of cxmt
社招3年以上研发技术类

深入业务视角,以多模态大数据建模及计算物理仿真为基础,借助AI赋能,帮助半导体工程/工艺/元件特性先行预测与优化,提升工程/工艺/元件研发效率。 工作职责: 1.基于半导体工程/工艺/元件研发需求,开发AI Agent,实现研发流程的自动化与智能化; 2.结合大模型技术(如LLM、多模态大模型等),构建智能化的业务交互与决策系统,提升研发效率; 3.基于产品全生命周期的生产大数据,开发根因查询(RCA)、虚拟量测(VM)、高级工艺控制(APC)、高级机台控制(AEC)等智能化解决方案; 4.开发基于业务驱动的智能工程/工艺/元件设计优化工具,结合物理信息神经网络(PINN)、复杂结构数字孪生、先进材料自动选型等技术,实现研发创新; 5.与半导体研发工程师深入合作,理解业务逻辑,打通数据流,设计并开发能够替代工程师重复操作的AI Agent; 6.探索大模型及AI Agent在半导体研发中的应用场景,推动AI技术与业务需求的深度融合。

更新于 2025-09-19合肥
logo of xiaohongshu
社招5-10年引擎

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、探索研发针对大语言模型、多模态大模型、StableDiffusion模型等模型的压缩技术,包括但不限于量化、蒸馏、剪枝、稀疏化等; 2、参与/负责多个业务场景中的模型压缩技术实现,对模型进行轻量化压缩,提高训练/推理效率,支持业务降本增效; 3、参与/负责针对英伟达GPU、华为昇腾NPU等不同的计算硬件,制定不同的模型压缩方案并在业务落地;

更新于 2025-10-18北京|上海