小鹏汽车端到端大模型软件部署工程师
任职要求
1,精通c++, 熟悉python; 2,具有cuda开发,深度学习模型部署,优化经验; 3,具备高性能软件的设计能…
工作职责
1,开发并维护自动驾驶端到端大模型的软件框架,与算法工程师协作,完成模型的转换和部署,以及模型的输出解码; 2,负责功能开发与联调测试,迭代优化; 3,负责板上资源的调度评测与优化。
1、负责具身智能相关模型云侧和端侧模型的性能优化和部署; 2、运用性能分析工具,对模型推理过程进行性能剖析,定位性能瓶颈,提出有效的优化方案,并通过实验验证优化效果; 3、通过量化、剪枝、蒸馏、算子融合、Cuda算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致; 4、与算法部门深度合作,进行算法与系统的联合优化。
团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok直播研发团队,旨在实现TikTok直播业务的研发工作,搭建及维护业界领先的产品。 加入我们,你能接触到包括:社交互动、营收活动、主播生态、消费订阅、游戏直播、公会&运营平台等核心业务场景,支持产品在全球赛道上高速发展; 也能接触到包括服务架构、大模型算法、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。 在这里,团队专业且纯粹,合作氛围平等且轻松。 目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 1、深入理解直播业务,优化和保障业务的稳定性; 2、海内外多机房建设,故障管理体系化,提合规区域运维效率; 3、提升研发质量,编程框架和语言性能优化,成本和预算优化; 4、研发合规和运维平台,提升全球工程师的协作效率。
1、深入分析用户需求与使用场景,设计自然流畅的交互逻辑,如多轮对话、情感识别及场景化服务; 2、以Golang/Rust为核心技术栈,设计大模型服务架构,涵盖感知规划调度等模块,支持高并发、低延迟的车载交互场景; 3、开发高性能API服务,支持多端单/双向通信调用,支撑富文本、音视频等载体信息下发;优化对应的Trace观测系统; 4、深度参与客户需求分析,通过场景化用例拆解,转化业务需求为服务端技术方案,实现用户数据隐私保护机制; 5、设计端云协同架构,实现端侧轻量化推理与云端复杂计算的协同,降低车载硬件资源消耗,针对车载场景网络特点,优化服务端通信协议。
团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok直播研发团队,旨在实现TikTok直播业务的研发工作,搭建及维护业界领先的产品。 加入我们,你能接触到包括:社交互动、营收活动、主播生态、消费订阅、游戏直播、公会&运营平台等核心业务场景,支持产品在全球赛道上高速发展; 也能接触到包括服务架构、大模型算法、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。 在这里,团队专业且纯粹,合作氛围平等且轻松。 目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 1、参与直播容量管理、成本管理和预算优化工作; 2、深入理解直播业务,理解产品视角下完整的营收和成本的逻辑,熟悉公司财务和经营分析体系; 3、深入理解国际化技术体系,设计或指导成本相关的优化工作; 4、构建数据驱动的成本优化模式,应用AI提升效率。