小鹏汽车性能优化工程师/专家
任职要求
1、3年以上 Java 开发经验;有ANR、Crash 等稳定性问题相关经验者优先;有主导过大型座舱稳定性保障项目者优先; 2、熟悉Android 系统、底层架构及运行机制,熟悉 Linux kernel,有架构治理、稳定性治理等相关经验者优先; 3、熟悉Fram…
工作职责
1、【性能优化】负责座舱系统的性能分析、测试,架构重构和优化,包括但不限于系统启动速度、应用打开时间、帧率等,保障高性能; 2、【稳定性建设】深入分析座舱系统运行情况,如死机、ANR、应用崩溃等问题,快速定位问题根因,总结经验并沉淀,并推动团队协作解决问题;对这些问题进行细粒度监控、跟踪和管理,并建设相应能力建设; 3、【横向拉通】Review 重点代码,通过不断优化架构,设计核心技术方案,沉淀通用组件和能力,推动关联团队落地; 4、【技术创新】关注智能座舱领域的新技术和新趋势,研究并引入先进技术,提升系统的整体性能和稳定性;参与技术难题攻关,对系统中的关键性能和稳定性问题进行专项研究和解决,不断提升系统的可靠性和用户体验;
大模型具备很强的泛化及理解世界能力,在小红书内的众多生产场景遍地开花,大模型的训练和部署已成为许多算法工程师的日常。在多团队、多业务频繁使用的大规模GPU集群上,如何能够通过高效的GPU调度策略,使大家不仅能丝滑地完成训练及部署任务,同时也能充分激发大规模GPU集群的效能,是行业公认的关键挑战。在这里,你可以聚焦LLM场景,接触到超大规模GPU集群,并使用真实负载数据进行深入分析及技术探索。欢迎加入我们,一起探索领先技术改变世界! 工作职责: 1、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、集群调度、GPU虚拟化、故障快速恢复、存储&网络加速等手段,提升大规模GPU集群的整体使用效率。 2、负责构建面向大模型训练、微调、推理、部署全流程LLMOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地。 3、持续关注业界最新的GPU资源调度相关技术动态,探索建设业界领先的资源调度策略及方法,构建下一代大规模AI资源调度系统。
1、利用图优化,编译优化,CPU/GPU优化等技术加速CV/NLP/Speech等AI算法推理,充分挖掘处理器算力,为快手数亿用户提供高效稳定的算法能力输出; 2、追踪业界在异构计算性能优化方面的发展,并进行预研和应用探索; 3、工作内容包括但不限于: (1)CUDA kernel开发; (2)编译优化技术开发; (3)onnx parser开发; (4)训推一体加速库开发; (5)多卡推理技术开发; (6)针对Transformer/bert网络结构性能优化。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责开发和优化字节跳动公司级的大模型推理框架; 2、主要通过GPU、CUDA性能优化的手段,结合线上实际情况,打造业界领先的高性能LLM推理引擎; 3、负责机器学习系统前瞻技术的调研和引入; 4、与算法部门深度合作,进行算法与系统的联合优化。