logo of dji

大疆多媒体算法工程师(北京)

校招全职算法地点:北京状态:招聘

任职要求


1. 本科及以上学历,计算机、电子工程、自动化、图像处理、计算摄影、模式识别、通信/信号处理等相关专业;
2. 具备扎实的图像处理算法基础,有良好的数学功底;
3. 良好的编程基础,熟练掌握Python/C/C++等编程开发技术和常用的数据结构算法、熟练使用业界常用的算法模型训练工具;
4. 项目经验加分项:
① 有手机端,PC 端视频处理算法研发落地经验,包括Mac,iOS,Andoid 、Windows;
② 有并行优化经验,熟悉Opengl 、Metal, CUDA等并行处理器编程语言; 
③ 有计算摄影和成像相关项目经验,如图像增强、人像增强,多目测量、投影几何、匹配和拼接、去模糊、去雾和超分等项目经验;
④ 有增稳、SLAM、VIO开发经验,如了解特征提取、追踪、优化、滤波、回环检测,IMU姿态估计等技术;
⑤ 有大模型(VLM、LLM)训练和应用经验,如了解LLaVa, Qwen-VL,CLIP 等技术;
5 . 在相关领域主流会议或期刊发表过论文者优(CVPR/ICCV/ECCV/NeurIPS/PAMI/ICML/ICLR/ICRA);
6. 具备较强的学习及问题分析能力,敢想敢做,追求极致,做事踏实有恒心,有反思意识,具备良好的团队协作能力,愿意和团队一起进步。

工作职责


加入我们,重塑影像创作的未来!
我们的独特战场——两类产品,双重创造力引擎​
作为硬件旗舰的“智慧搭档”​​,将为无人机/手持设备注入​​创作全链路的智慧基因​​:从拍摄后的素材智能归集、AI辅助剪辑,到一键分享的极致流畅体验;
挑战点:​​重构创作效率​​——让用户从繁琐操作中解放,专注创意本身。
作为软件驱动的“颠覆者”​​,将以​​画质增强算法、视频的拼接算法、AI场景智能识别、影像叙事引擎​​为核心武器,打造“人无我有”的竞争力壁垒。
突破点:​​让普通设备输出专业级影像​​——通过算法突破硬件物理限制,重新定义画质天花板。

1. 负责DJI 产品视频智能成片,视频画质提升,图像匹配对齐相关算法开发和优化工作;
2. 负责参与上述功能在产品侧的落地;
3. 持续跟踪国内外视频理解和处理技术相关进展,并根据业务需要进行创新和落地。
包括英文材料
学历+
图像处理+
模式识别+
算法+
Python+
C+
C+++
数据结构+
iOS+
Windows+
CUDA+
SLAM+
大模型+
CVPR+
ICCV+
ECCV+
NeurIPS+
ICML+
相关职位

logo of xiaohongshu
校招多媒体算法

1、参与点,直播各场景音频算法,引擎和策略的研发,保障高质量的音频消费体验; 2、参与直播音频引擎的开发,包括音频采集,渲染和混音模块,在多平台完成集成和性能调优; 3、参与音频策略算法的研究,包括但不限于: ①语音降噪(Noise Suppression),回声消除(AEC)等3A算法 ②语音合成与修复等AI算法; ③抗丢包与弱网对抗技术(FEC、PLC)等编解码算法 4、跟踪业界前沿音频技术,参与3D 音效和空间音频等方向的调研与业务落地; 5、参与音频质量评测体系建设,配合进行主观/客观音质测试与问题定位。

更新于 2025-09-10
logo of xiaohongshu
校招多媒体算法

1、 在音视频技术、人工智能、视频图像处理和生成等领域开展前沿技术研究,保持算法在工业界和学术界的领先; 2、 探索前沿技术在视频图像质量评估、视频图像分析及处理、智能编码、智能抽帧等技术方向上落地。

logo of xiaohongshu
社招3-5年多媒体算法

1.支持语音识别及音频理解在小红书丰富业务场景的落地,持续优化大模型语音识别效果 2.跟进最领先的音频理解技术体系,包括但不限于提出新的音频理解技术框架、改进现有的算法、持续提升相关技术及业务指标,鼓励撰写论文及申请专利。

更新于 2025-09-09
logo of xiaohongshu
校招多媒体算法

1、参与点,直播各场景音频算法,引擎和策略的研发,保障高质量的音频消费体验; 2、参与直播音频引擎的开发,包括音频采集,渲染和混音模块,在多平台完成集成和性能调优; 3、参与音频策略算法的研究,包括但不限于: ①语音降噪(Noise Suppression),回声消除(AEC)等3A算法 ②语音合成与修复等AI算法; ③抗丢包与弱网对抗技术(FEC、PLC)等编解码算法 4、跟踪业界前沿音频技术,参与3D 音效和空间音频等方向的调研与业务落地; 5、参与音频质量评测体系建设,配合进行主观/客观音质测试与问题定位。

更新于 2025-09-10