logo of mi

小米新业务部-AI大模型加速优化算法工程师

社招全职2年以上A7018地点:北京状态:招聘

任职要求


岗位要求:
1.从事大模型、AIGC、深度学习、AI芯片等两个或以上相关领域工作经验,有2年及以上的工作经验,主导或者作为主要参与者;
2.对AI算法(尤其是大模型、AIGC、AD算法)的量化剪枝、网络结构搜索、稀疏化、性能效果优化和训练调参等有丰富开发调试经…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


岗位职责:
1.进行大模型、多模态大模型、AIGC模型、自驾模型等多个方向端侧加速优化算法的研发与探索
2.工作内容包括但不限于上述模型的训练调优、量化、剪枝、小型化、稀疏优化、投机推理、专用加速、结构搜索(NAS)等
3.与芯片团队配合针对相关加速特性进行芯片算法联合设计与优化,并提供针对自研芯片的完整算法加速解决方案
4.帮助客户在自研芯片上进行算法加速优化的模型加速优化训练及交付
包括英文材料
大模型+
深度学习+
还有更多 •••
相关职位

logo of honor
校招研发类

1、参与多模态大模型的结构设计、预训练任务、模型训练和推理加速等工作,包括但不限于多模态预训练、跨模态检索等; 2、参与多模态大模型的应用构建,结合现有相关业务和开源技术,对多模态大模型的特定能力进行针对性优化; 3、研究未来生活中的端侧创新应用场景,例如个性化的手机助手、个人知识库,探索技术边界; 4、撰写技术报告和论文,积极参与公司内外部的技术交流与合作,推动团队在多模态大模型技术水平和业务落地能力上的提升,增强团队在行业内的影响力和知名度。

更新于 2025-08-07上海
logo of dingtalk
社招5年以上技术类-开发

1. 推理引擎应用与优化: 负责AI模型的性能优化与部署,应用业界主流推理框架(如vLLM、SGLang、TensorRT、ONNX Runtime、 TVM、OpenVINO等)对模型进行加速 2. 模型性能深度分析与调优: 针对公司业务场景,对各类AI模型(包括但不限于大语言模型LLM、VL、ASR、TTS等)在不同硬件平台(GPU、PPU、昇腾、海光等)上进行深度性能分析、定位瓶颈并制定优化方案 3. 模型轻量化技术实践: 熟练运用模型量化(PTQ/QAT)、剪枝、蒸馏等技术,在满足业务精度要求的前提下,最大化提升模型推理速度、降低资源消耗 4. 自动化部署与MLOps流程建设: 建立并完善模型部署、监控和迭代的自动化流程(CI/CD、MLOps),确保模型稳定、高效地服务内外部客户 5. 前沿技术跟进与引入: 持续跟进行业前沿的AI推理加速技术,探索并引入新的优化方案、工具及硬件(如LLM推理优化库、新型AI芯片等),持续提升业务模型的部署效率和运行性能

更新于 2025-08-18杭州
logo of aliyun
社招5年以上云智能集团

1、 负责头部高增长KA客户的维护及商机持续挖掘,推动行业/区域高潜新客户的商机拓展与目标达成: -主动洞察所在区域/市场,识别出关键/潜在客户,并主动找到关键决策链,识别客户真实需求,构建立体的客户沟通界面; -协同SA(解决方案架构师)、产研等资源,挖掘客户向全栈AI转型的需求(如AI算力、大模型部署、智能体等),形成有效商机,明确销售及解决方案策略,设计合作路径并沟通执行; -持续开拓新老客户的高层关系,通过沟通和影响力、资源整合等策略的运用,提高call high技能,主导关键项目谈判,推动技术方案与客户需求的精准匹配,推进客户的AI全栈和云平台建设落地转化,达成业绩; -与内部电销团队配合,联合挖掘商机并关单,并Coach电销团队,提升关联团队的整体能力和市场嗅觉;   2、 AI全栈产品和技术价值传递: -深入理解AI全栈产品,深刻洞察客户业务需求,基于行业和客户需求洞察,帮助客户理解大模型、AI算力、云产品核心方案的技术价值,思考并设计与友商的差异化竞争优势,传递阿里云端到端的客户价值; -针对客户对AI算力、大模型应用场景落地等需求,通过标杆案例及场景化演示,向客户高层展示阿里云AI全栈产品的竞争优势,确保技术方案与客户业务目标深度绑定;   3、 商务运作和业务支持: -完成Leads to Cash销售全流程的执行和跟踪,支撑复杂项目运作,参与招投标流程管理、项目管理、风险管理,协同产研、TAM交付和SA等资源,及时发现并解决项目交付问题,支撑客户业务目标达成; -将客户使用中遇到的影响客户体验的问题,反向推动内部产品解决方案和流程体系的改进; -积极发掘并推进与云、AI领域全方位合作伙伴和市场推广渠道,构建可持续的行业合作生态。

更新于 2026-01-10北京|深圳|杭州
logo of mi
社招2年以上P0751

1. 基于深度学习的Low Level算法(如降噪、Demosaic、超分辨率、插帧等)、High Level算法(如目标检测、语义分割、显著性检测、深度估计等)、大模型技术(LLM、AIGC、多模态等)的研发与探索 2. 上述方向的模型优化工作,包括但不限于模型量化、剪枝、稀疏化、结构搜索(NAS) 3. 负责效果,功能原型设计,并支撑算法在各应用场景的商用落地; 4. 与系统架构,软件,IC设计/验证,调试工程师共同完成相应多媒体IP 实现方案的开发工作;

更新于 2024-01-21北京|上海