蔚来AI平台研发工程师(计算加速/智算方向)
任职要求
1. 全日制统招硕士以上学历,计算机、人工智能相关专业; 2. 熟悉Go/C++/Python中的一种及以上,有训练/推理/微调平台研发、优化或模型训练经验; 3. 熟悉深度学习、神经网络相关…
工作职责
1.负责公司AI平台架构设计,包括但不限于改善训练及推理效率、超大规模训练、智算平台等; 2.负责设计、研发大模型算法开发组件,包括但不限于微调软件框架、模型流水线等; 3.规划AI平台技术发展方向,跟进业界前沿技术,实现面向端到端大模型系统的极致性能优化。
-负责建设业界领先的AI异构算力容器平台,提供高性能、高稳定性、高易用性的混合云产品,支持AIGC、智算中心、智驾、金融能源等客户AI应用高效部署 -负责云原生AI容器相关产品的架构设计和产品研发,引入开源社区先进的AI框架、AI调度、AI工作流和AI可观测能力组件构建全栈AI应用云原生解决方案 -结合 SOTA 模型训练推理优化原理,深入模型结构与设计思路,将训练推理优化手段工程实践化,为客户提供系统性加速方案,提升训推效率 -针对大规模异构集群场景下,探索训推任务管理、异构资源调度、虚拟化混布、容器存储、高性能网络、分布式训练和推理等技术的创新和应用 -探索业界最新技术方向,参与机器学习框架等开源社区,提升百度混合云AI核心竞争力,提升团队技术影响力
团队介绍 团队长期深耕AI算法研发、AI基础架构建设、AI服务应用打造,负责从AI算法研发、性能优化加速、工程服务化与云端部署、服务调度与资源优化、到服务管理与运维在内的完整AI落地运用流程,覆盖线上数据到模型训练、训练模型到线上服务的闭环。近期重点聚焦AIGC在公司内容团队和产研团队的使用,通过大模型的能力,持续推动爱奇艺在内容创作、生产、分发、以及用户体验上的创新、优质、高效、自动化与智能化。欢迎愿意长期深耕AI领域的同学加入我们! 工作职责 - 参与AI工程服务化工作,将算法团队研发的AI能力初始原型进行服务化,落地成为业务团队线上稳定可用的AI应用 - 参与大模型训练平台、推理平台建设,包括但不限于分布式训练框架调优、推理引擎优化、模型量化及加速等 - 参与AI基础设施建设,包括计算资源管理、网络架构设计、存储系统优化等,提升资源利用率,降低大模型研发与应用成本 - AI领域最新进展的技术调研、引入改造、原型设计与开发等
1、面向AI应用场景设计开发业界领先的AI平台,包括prompt工程,RAG工程、模型微调、推理加速等能力; 2、负责大模型场景下多领域的数据工程,包含知识库数据的高质量处理,Prompt提示词的优化,模型微调数据集的质量提升; 3、负责大模型场景下模型推理框架的性能优化方案的设计与实现; 4、设计训练和优化大模型,跟踪和研发代码大模型的预训练、持续训练、SFT、RLHF等技术; 5、设计与实现AI智能体应用的编排定义,提升企业应用的智能度。