理想汽车图编译器开发工程师-北京
任职要求
1. 计算机体系结构,软件工程、人工智能相关专业,硕士及以上学历; 2. 以编译器作为专业方向,有经典编译器项目经验; 3. 对机器学习、…
工作职责
为理想汽车AI芯片研发数据流图算融合编译器,将自动驾驶端到端模型、大语言模型等业内前沿算法高效映射到NPU作推理或训练。
-负责AI模型对昆仑AI芯片的适配和性能优化工作,完成客户需求的落地任务 -为昆仑AI芯片各系列高性能加速芯片提供推理及训练软件栈,包括框架,图编译器以及周边产品的技术支持 -支持主流框架的模型对接,算法优化,上线部署,并探索新一代AI芯片编程模型和架构 -参与昆仑AI芯片技术栈相关的研发工作
1、利用图优化,编译优化,CPU/GPU优化等技术加速CV/NLP/Speech等AI算法推理,充分挖掘处理器算力,为快手数亿用户提供高效稳定的算法能力输出; 2、追踪业界在异构计算性能优化方面的发展,并进行预研和应用探索; 3、工作内容包括但不限于: (1)CUDA kernel开发; (2)编译优化技术开发; (3)onnx parser开发; (4)训推一体加速库开发; (5)多卡推理技术开发; (6)针对Transformer/bert网络结构性能优化。
岗位职责: 1、负责小红书搜广推-机器学习训练框架的研究与开发,服务于全公司各个产品; 2、参与机器学习训练框架底层组件的抽象,设计,优化与落地; 3、与全公司算法部门深度合作,为重点项目进行算法与系统的联合优化。
团队介绍:字节跳动豆包大模型团队(Seed)成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 豆包大模型团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、以自研推理引擎为中心的在线推理服务和近离线批式推理任务框架,负责超大规模机器学习系统架构的设计开发,解决系统高并发、高可靠性、高可扩展性等技术难关,为搜索、推荐、审核等业务提供深度模型推理全场景端到端解决方案; 2、针对PyTorch、TensorFlow等框架提供高自动化、极致性能的模型优化方案,技术方案不限于子图匹配、编译优化、模型量化、异构硬件等; 3、面向全球多地域超大规模GPU算力集群,通过弹性调度、GPU超卖、任务编排等方式不断提升算力利用率; 4、与算法部门深度合作,进行算法与系统的联合优化。