小鹏汽车多模感知C++软件开发工程师
社招全职地点:北京状态:招聘
任职要求
1. 本科及以上学历,计算机/软件工程/通信/电子工程相关专业,专业基础扎实 2. 精通C++ STL开发,了解其实现原理,熟练使用modern C++ 新特性 3. 熟悉计算机体系结构,掌握操作系统核心概念 4. 参与过CV/大模型算法工程化项目 5. 具备ROS/DDS相关开发经验 6. 有过大型软件框架设计或深入阅读过优秀开源工程经验优先 7. 熟悉deep learning基本原理优先 8. 参与LeetCode编程、蓝桥杯等比赛有获奖经历优先
工作职责
1. 协同算法同学设计&实现多模(图像/文本/音频)计算软件框架,提供高性能/高可靠的MLLM能力 2. 负责基于平台软件实现调度框架、前后处理等功能模块 3. 负责多模计算软件相关的系统性能调优,包括应用层、中间件、底层软件等 4. 基于高性能计算平台完成完成软硬件的联调和验证
包括英文材料
学历+
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
ROS+
https://www.youtube.com/watch?v=92Zz5nnd41c&list=PLk51HrKSBQ8-jTgD0qgRp1vmQeVSJ5SQC
https://www.youtube.com/watch?v=HJAE5Pk8Nyw
Ready to learn ROS2 and take your robotics skills to the next level?
https://www.youtube.com/watch?v=MWKnMPX0Yjg&list=PLU9tksFlQRircAdEplrH9NMm4WtSA8yzi
Do you want to know more about ROS the Robot Operating System?
相关职位
校招
1、协同算法同学设计&实现多模(图像/文本/音频)计算软件框架,提供高性能/高可靠的MLLM能力 2、参与trigger、recall、decision making 等核心模块软件开发 3、负责多模计算软件相关的系统性能调优,包括应用层、中间件、底层软件等
更新于 2025-06-23
校招研发类
1、基于手机、Pad、PC、手表、耳机、电视、路由等终端设备,通过AI多模多设备融合算法识别用户状态(身份识别、行为识别、运动健康、人机交互等),例如通过生理特征、行为特征、图像音频特征的融合,识别机主、年龄、性别、交通工具、生理心理健康、活动行为和人机交互; 2、跟踪感知算法最新理论和技术发展,提出创新型的解决方案,以实现关键技术突破; 3、从事本领域特性的端到端评估,推动用户体验提升,对产品上市后的质量表现负责。
更新于 2025-08-08
实习核心本地商业-基
随着多模态大模型的发展,虚拟人交互也迎来智能化和拟人化的升级。 传统的2D虚拟人主要专注于语音与嘴型对齐,而大模型时代的虚拟人需具备多模感知和推理的能力,视觉生成需具备高度拟人化。课题研究内容包括但不限于: 1)基于多模态大模型构建端到端交互虚拟人模型,实现智能双工交互,人、物、场景交互,高度拟人化等能力。 2)Human Video Model:构建具备高质量人脸、人体、人物交互生成能力的虚拟人基座。
更新于 2025-05-23