小米算法数据优化工程师
任职要求
1、熟悉主流自动驾驶感知算法,熟悉CNN,Transformer以及优化架构原理 2、有AutoML,蒸馏,自监督学习等相关经验 3、熟悉Python开发、算法和数据结构 4、具备扎实的研发功底,有在相关领域(IJCV、PAMI、CVPR、ICCV、ECCV、NIPS、AAAI 等)发表论文者优先;或在相关领域竞赛(ImageNet、COCO、Kitti、Waymo、nuScenes等等)中取得较好成绩者优先。
工作职责
1. 数据“蒸馏”算法: 研发主动学习(Active Learning)与核心集选择(Core-Set Selection)算法,从PB级数据中自动化地“炼”出信息密度最高的“黄金数据集”,实现训练成本与模型性能的最优平衡。 2. 难例(Hard-Case)挖掘算法: 构建多模态难例挖掘引擎,融合图像、点云与模型内部状态,主动“捕获”长尾和边缘场景,持续拓宽模型的能力边界。 3. 算法归因与可解释性(XAI): 基于可解释性AI与因果推断,开发自动化归因工具链。当模型失效时,能精准定位根因是来自数据、标注还是模型自身,实现从“现象”到“根因”的穿透。
团队介绍:Data-电商-平台治理-内容理解基础算法团队,主要 focus 在 NLP/CV/多模态的大模型算法和基础算法研发上,旨在沉淀CV/NLP/多模态方向上的业界SOTA模型,针对电商数据优化算法,支持模型训练和推理加速,提升电商业务效果。 1、模型压缩和推理框架开发:推理加速的研究,包括但不限于模型量化、剪枝、TensorRT、TensorRT-LLM推理优化等; 2、梳理&沉淀算法库:抽象算法接口,提高算法/预训练模型的复用率,同时优化数据采集和模型训练的流程,提升效率; 3、技术输出:定期分享训练和推理优化技术,赋能业务,沉淀专利和论文。
团队介绍:Data-电商-平台治理-内容理解基础算法团队,主要 focus 在 NLP/CV/多模态的大模型算法和基础算法研发上,旨在沉淀CV/NLP/多模态方向上的业界SOTA模型,针对电商数据优化算法,支持模型训练和推理加速,提升电商业务效果。 1、模型压缩和推理框架开发:推理加速的研究,包括但不限于模型量化、剪枝、TensorRT、TensorRT-LLM推理优化等; 2、梳理&沉淀算法库:抽象算法接口,提高算法/预训练模型的复用率,同时优化数据采集和模型训练的流程,提升效率; 3、技术输出:定期分享训练和推理优化技术,赋能业务,沉淀专利和论文。
方向一: 1. 负责多模态大模型的基础能力提升,图文多模态模型的下游算法研究,图文多模态技术在AI搜索、图片结构化提取、图片内容理解等应用领域云侧和端侧的研究等 2. 跟进业界前沿技术,持续提升团队在图文多模态算法方面的技术积累。 方向二: 1. 负责多模态大模型压缩算法研发,探索并实现极低bit量化技术和稀疏化技术,保持推理精度的同时减少模型存储和计算资源消耗;多模态大模型编解码加速算法研发,降低端侧模型推理成本; 2. 参与端侧大模型技术体系建设,探索和实现高效大模型架构,开发和优化内部模型端侧化部署工具链,跟进大模型前沿技术发展趋势,探索相关算法的创新优化,发表高质量研究论文。 方向三: 1. 参与AI搜索,小布记忆等业务交付中的算法方案设计,模型训练等,持续提升算法能力,改善产品体验; 方向四: 1、 负责参与小布助手统一意图理解与任务编排的算法及数据工程优化 方向五: 1. 参与个性化大模型算法设计、实现和优化,提升模型用户特征提取、行为挖掘及精准画像等核心能力; 2. 协同产品与工程团队,推动个性化大模型在手机业务中的创新应用,持续探索技术突破点并推动团队技术迭代,保持行业领先性。