小米Linux C/C++ 音视频传输框架研发工程师
任职要求
1. 熟练掌握C/C++,有良好的代码风格和编程习惯; 2. 熟悉Linux下多线程/进程及网络开发,熟悉TCP/IP协议栈;熟悉内存管理、无锁编程、性能调优技术; 3. 有NAT穿透、P2P打洞业务的开发经验;熟悉WebRTC、RTP/RTCP、STUN、TURN、ICE等协议者优先; 4. 熟悉Make、CMa…
工作职责
1. 负责P2P传输架构的功能设计、开发以及性能优化; 2. 优化P2P传输系统,构建稳定、高可用、低延迟的传输服务; 3. 负责音视频传输架构的研发和优化迭代,建立行业领先的领域能力。
我们正在寻找对人工智能、多模态数据处理、系统性能优化感兴趣的实习生,参与一个面向多模态数据获取、解析、压缩与高效传输的研究课题。该课题聚焦于提升多模态系统在复杂环境下的实时性表现与资源利用率,具有广泛的应用前景(如智能运维、RAG检索增强生成、边缘计算等)。你将参与的工作包括但不限于: 1. 多模态数据采集与预处理:从网页、API、数据库、摄像头、麦克风等来源获取文本、图像、音频和视频数据; 2. 多模态数据解析与特征提取:使用OCR、ASR、NLP、CV等技术解析不同模态内容; 3. 模型轻量化与加速:探索基于Transformer、CNN、LSTM等模型的压缩、蒸馏、量化方法; 4. 系统级优化与部署:设计低延迟、低资源占用的数据处理流程,支持在边缘设备上运行; 5. 性能评估与实验分析:构建测试集,评估系统的吞吐量、响应时间、准确率等关键指标; 6. 撰写技术文档与研究报告:整理实验过程、结果与改进建议。 技术要求(优先但不强制): 1. 熟悉Python编程语言,有良好的代码规范; 2. 了解基本的NLP、CV或语音识别技术; 3. 掌握至少一种深度学习框架(PyTorch/TensorFlow); 4. 熟悉Linux系统及常用命令行工具。 有以下经验者优先考虑: 1. 多模态任务处理经验(如CLIP、Flamingo等); 2. 模型压缩与部署经验(如TensorRT、ONNX、OpenVINO、TVM等); 3. 使用过音视频处理工具(如FFmpeg、OpenCV、Whisper、YOLO等); 4. 有一定系统编程能力(C/C++、CUDA、FPGA基础)。
1. 负责澎湃OS电视平台多媒体系统级开发 2. 负责安卓多媒体开发和优化工作, 包括媒体库与硬件平台的开发与调试工作 3. 负责设计和开发安卓电视系统的多媒体播放器,包括音频、视频和图片等多种媒体格式的播放,以及多媒体播放器的功能扩展和升级
1. 参与产品上的WIFI/BT/私有GFSK/UWB的功能和应用开发,根据需求完成无线子系统内功能模块定义,输出设计方案/测试用例; 2. 负责WIFI/BT/私有GFSK/UWB子系统软件框架设计,嵌入式系统应用程序开发和集成测试,解决疑难问题,完成测试验收和交付; 3. 针对项目中复杂功能模块或性能指标瓶颈进行技术拆解,跨部门拉通,并组织技术攻关,形成解决方案和开发流程,实施计划并落实交付; 4. 探索无人机、手持相机、遥控器、智能手机眼镜等设备之间新的生态互联,新的人机交互方式等,推动内外部资源实现量产交付。