小米Linux C/C++ 音视频传输框架研发工程师
任职要求
1. 熟练掌握C/C++,有良好的代码风格和编程习惯; 2. 熟悉Linux下多线程/进程及网络开发,熟悉TCP/IP协议栈;熟悉内存管理、无锁编程、性能调优技术; 3. 有NAT穿透、P2P打洞业务的开发经验;熟悉WebRTC、RTP/RTCP、STUN、TURN、ICE等协议者优先; 4. 熟悉Make、CMake等编译工具,熟悉Git版本管理工具;熟悉shell、python等脚本编程;有跨平台编译经验者优先; 5. 扎实的计算机基础,具备优秀的学习能力和逻辑思维能力,善于分析问题和解决问题,有互联网行业经验优先。 加分项: - 有PCDN或IOT智能硬件开发经验者优先。 - 有Golang 或 Java开发经验者优先。
工作职责
1. 负责P2P传输架构的功能设计、开发以及性能优化; 2. 优化P2P传输系统,构建稳定、高可用、低延迟的传输服务; 3. 负责音视频传输架构的研发和优化迭代,建立行业领先的领域能力。
-为视觉大模型项目交付的方案、质量、效率负责 -完成项目交付过程中的技术对接、方案设计及核心功能的开发 -参与团队开发过程中的Code Review、文档撰写、复杂问题排查等工作 -参与团队公共技术组件的抽象、沉淀和架构优化
-为视觉大模型项目交付的方案、质量、效率负责 -完成项目交付过程中的技术对接、方案设计及核心功能的开发 -参与团队开发过程中的Code Review、文档撰写、复杂问题排查等工作 -参与团队公共技术组件的抽象、沉淀和架构优化
我们正在寻找对人工智能、多模态数据处理、系统性能优化感兴趣的实习生,参与一个面向多模态数据获取、解析、压缩与高效传输的研究课题。该课题聚焦于提升多模态系统在复杂环境下的实时性表现与资源利用率,具有广泛的应用前景(如智能运维、RAG检索增强生成、边缘计算等)。你将参与的工作包括但不限于: 1. 多模态数据采集与预处理:从网页、API、数据库、摄像头、麦克风等来源获取文本、图像、音频和视频数据; 2. 多模态数据解析与特征提取:使用OCR、ASR、NLP、CV等技术解析不同模态内容; 3. 模型轻量化与加速:探索基于Transformer、CNN、LSTM等模型的压缩、蒸馏、量化方法; 4. 系统级优化与部署:设计低延迟、低资源占用的数据处理流程,支持在边缘设备上运行; 5. 性能评估与实验分析:构建测试集,评估系统的吞吐量、响应时间、准确率等关键指标; 6. 撰写技术文档与研究报告:整理实验过程、结果与改进建议。 技术要求(优先但不强制): 1. 熟悉Python编程语言,有良好的代码规范; 2. 了解基本的NLP、CV或语音识别技术; 3. 掌握至少一种深度学习框架(PyTorch/TensorFlow); 4. 熟悉Linux系统及常用命令行工具。 有以下经验者优先考虑: 1. 多模态任务处理经验(如CLIP、Flamingo等); 2. 模型压缩与部署经验(如TensorRT、ONNX、OpenVINO、TVM等); 3. 使用过音视频处理工具(如FFmpeg、OpenCV、Whisper、YOLO等); 4. 有一定系统编程能力(C/C++、CUDA、FPGA基础)。