logo of sensetime

商汤影微芯片业务-多模态大模型研究员

校招全职算法研究地点:北京 | 上海 | 深圳 | 西安状态:招聘

任职要求


1. 计算机、电子信息、数学等相关专业;
2. 熟练使用PythonC/C++中至少一种编程语言,掌握PyTorchTensorflow深度学习框架之一;
3. 在计算机视觉、多模态算法等方向上有一定研究经验,对多模态算法的研究和落地具有强烈的热情;
4. 在CVPR/ICCV/ECCV/NeurPS/ICLR/ACL/EMNLP等学术顶会有相关论文发表者优先;
5. 参与过有影响力的多模态算法项目者优先;

工作职责


1. 参与多模态模型的训练(Pretrain、Post-Training、RL),可处理图像,文本,语音等多模态数据,负责网络结构与训练策略优化等
2. 探索多模态领域内的最新研究成果和技术进展
3. 构建和维护多模态数据集,负责多模态大模型的业务落地和推广
4. 将研究内容总结为技术文档、论文、专利或技术报告
包括英文材料
Python+
C+
C+++
PyTorch+
TensorFlow+
深度学习+
OpenCV+
算法+
CVPR+
ICCV+
ECCV+
相关职位

logo of sensetime
校招算法研究

1.构建多模态感知与理解系统,融合RGB、TOFIR、双目等多种传感器数据,实现从视觉到语义的高质量感知; 2.参与跨模态视觉-语言-动作(VLA)模型设计与开发,实现对图像属性、空间关系、动作执行等复杂场景的统一建模; 3.推进大模型在智能设备上的落地,包括图像-语言对齐、场景理解、指令驱动行为等能力

更新于 2025-08-19
logo of sensetime
校招算法研究

1.相机图像感知核心算法研发,包括图像稳定(EIS/OIS)、目标检测、跟踪与运动建模等模块提升图像质量与理解基础; 2.推进大模型在智能设备上的落地,包括图像-语言对齐、场景理解、指令驱动行为等能力; 3.构建zero-shot或few-shot任务适应机制,在变化场景中增强模型泛化能力;

更新于 2025-08-19
logo of sensetime
校招算法研究

1. 参与视频AI-ISP算法的设计开发,负责关键算法模块(多帧图像配准,解马赛克,去噪,HDR,Tone mapping,画质增强,色彩增强等)的开发与性能优化。 2. 跟踪调研前沿ISP算法并进行实现和性能评估。

更新于 2025-08-19
logo of sensetime
校招芯片设计

1、负责图像或视频的主客观画质测试,设计主客观测试用例并执行,评测画质效果并及时反馈相关问题; 2、与算法、工程紧密合作,牵引并推动画质效果的优化; 3、分析输出画质评测报告,对最终画质效果负责。

更新于 2025-08-19