小米高级算法工程师（工业视觉）

社招全职5年以上A348132026-03-27地点：北京状态：招聘

扫码手机上打开

任职要求

1. 教育背景与经验
- 计算机、人工智能、自动化、数学、电子信息等相关专业，硕士及以上学历；
- 5年以上AI算法研发经验，其中至少1-2年专注于大模型（LLM或VLM等）相关领域的研发。
2. 工程与编程能力： 
- 精通Python编程，熟练掌握PyTorch/TensorFlow/JAX等至少一种主流深度学习框架，能快速复现前沿算法；
- 具备良好的软件工程素养和代码规范。
3. 算法能力：
- 熟悉CLIP、SAM、QWEN系列等多模态模型的原理和应用，具备处理图像-文本对齐、视觉问答（VQA）、图像描述生成等任务的实践经验；
- 精通Agent的设计理念和技术栈，有使用LangChain、LlamaIndex或自研框架构建基于知识库的智能Agent（如RAG系统）的完整项目经验；
- 具备丰富的大模型微调（Fine-tuning）实战经验，熟练掌握LoRA、QLoR…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 多模态大模型研发与落地：
- 负责工业视觉质检领域多模态大模型的构建、训练与优化，解决传统CV模型在复杂背景、小样本、零样本缺陷的识别率低的问题。
- 研究并应用多模态融合技术（如图像+文本描述、图像+参数），提升模型对工业缺陷的语义理解与泛化性能，同时实现工业缺陷的自然语言描述生成和智能问答。
- 搭建面向大模型的质检数据生产与清洗的pipeline，包括高质量图文对齐数据的构建、合成数据生成等，并设计模型效果评估体系，驱动算法的持续迭代与优化。
- 针对工业场景的实时性与高精度要求，负责大模型的轻量化部署与推理加速（如量化、剪枝、蒸馏）。
2. 质检Agent智能体构建：
- 负责设计并主导研发面向工业视觉质检场景的智能Agent，具备多模态理解能力，能够融合图像、文本（如工艺标准SOP）、传感数据等信息，实现对缺陷的自动化判定、描述、归因及溯源。
- 构建面向质检场景的Agent工作流（Workflow），包括任务规划（模型自动择优等）、节点调用（训练任务的全流程、工具搭建业务流等等）、结果反馈。
- 负责构建并维护质检领域的专业知识库（RAG），结合向量数据库技术，提升Agent在特定缺陷场景下的准确性和可解释性。
3. 大模型微调与优化：
- 针对工业质检的小样本、长尾分布问题，设计并实施高效的大模型微调策略（如LoRA、P-Tuning等），提升模型在特定质检任务上的识别检出能力。
- 持续跟进多模态大模型、AIGC、Agent等领域的最新前沿技术进展，并引领团队进行技术预研和创新，探索其在工业缺陷检测中的应用潜力。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

算法+

大模型+

Python+

PyTorch+

TensorFlow+

JAX+

深度学习+

AI agent+

LangChain+

还有更多 •••

登录查看完整学习资料

相关职位

嵌入式软件算法高级工程师（能源管理控制盒/工业物联网网关方向）00000564

社招5年以上研发技术类

1、1.主导开发能源管理控制盒、备电盒的嵌入式固件，实现光伏、储能、电网、负载（包含充电桩和热泵）的能量流实时监控与控制策略（削峰填谷、自发自用、备电模式、经济性储热充电等），开发能源调度实时算法； 2.负责嵌入式产品功能需求分析和设计工作，主导嵌入式智能屏应用程序开发，确保其⾼效运⾏和稳定性，优化产品的实时性能，确保系统在实时应用场景中的高效和可靠运行 3.编写和维护优化相关的技术文档，包括详细设计文档、用户指南、产品手册等 4.实现本地 AI/算法模块（PV 发电预测、天气预测、动态电价预测、负载预测、电价响应策略、负载控制策略） 5.实现多品牌设备驱动库和协议适配，包含光伏逆变器、混合逆变器、充电桩、热泵等，集成与逆变器、电池、优化器、充电桩、热泵、智能电表的通信接口（Modbus RTU/TCP、CAN、RS485、DL/T 645 等） 6.支持与云端平台的双向通信（MQTT/HTTP/WebSocket），实现远程策略下发与 OTA 升级；构建边缘计算引擎，设计双系统容灾架构（主控FreeRTOS+备份Zephyr） 7.主导与第三方算法团队合作开发，如VPP调度接口开发，实现用户侧灵活负荷调度与电力市场交易 (100) xxxxxx

更新于 2026-02-04深圳

高级算法工程师

社招3-10年SOFTWARE

我们希望你既懂经典 OCR，也愿意拥抱大模型范式。岗位职责：负责输入法多模态识别核心算法的研发，融合传统识别与大模型能力，打造精准、智能、低延迟的输入体验。 1、核心算法：研发在线/离线手写识别、OCR 文字识别核心模型。 2、大模型应用：探索并落地多模态大模型（VLM）在手写理解、图文识别、上下文纠错、智能补全中的应用。 3、数据与训练：构建高质量数据闭环，设计后训练 / 微调 / 蒸馏方案，持续提升模型泛化能力。 4、端侧落地：将大模型能力通过量化、蒸馏、剪枝等手段落地移动端，平衡效果、延迟与功耗。 5、效果迭代：通过 AB 实验、Badcase 分析、线上监控驱动算法持续优化。

更新于 2026-07-15上海

高级算法工程师

社招3-5年技术

1、追踪前沿机器学习、数据挖掘、大模型技术，应用于搜索、推荐场景核心链路进行模型优化，提升效率指标，增加用户的粘性； 2、将推荐、搜索、广告等相关算法应用于用户query意图理解，联想sug词，相关性，线索转化等各个环节，平衡用户体验和商业化变现； 3、基于实时数据流处理、大规模特征存储，分布式深度学习平台，对搜推召回、排序、重排序等算法效果和性能进行持续优化。

更新于 2026-07-17北京

高级算法工程师

社招5-10年SOFTWARE

方向一：负责针对相机的计算成像算法的开发和迭代： 1.负责基础图像算法如3R（NoiseReduction, SuperResolution, HDR）, 多帧多摄等； 2.负责图像后处理算法如美颜、色彩映射，图像渲染等； 3.负责软硬件结合图像算法如ISP（Image signal processor）算法的开发调优，负责白平衡、自动对焦、自动曝光控制、色彩还原、多摄立体视觉、防抖算法的迭代进化等；方向二：利用机器学习、深度学习、模型压缩及小型化等AI技术，解决Low-level画质处理、语义理解等技术问题，并实现技术的工程化部署；方向三：负责相关算法在Android计算平台和手机soc上部署的架构设计和复杂度优化，达到实际产品应用要求。

更新于 2025-11-18深圳