OPPO高级AI研究员(推理加速)-博士
任职要求
上海方向: 1.计算机科学、软件工程、人工智能等相关专业。 2.扎实的算法与数据结构基础,熟练掌握Python或C++语言,加分项:ACM/ICPC等编程比赛获奖者。 3.熟悉主流大模型架构、训练/推理流程及加速方法。 4.良好的科研能力。加分项:在AI系统顶会或期刊(MLSys、ASPLOS、OSDI等)发表过相关论文。 5.强烈的技术热情与自驱力,具备优秀的逻辑思维与复杂问题拆解和解决能力。 深圳方向: 1.计算机、软件工程、数据挖掘、机器学习、人工智能、数学等相关专业; 2.至少熟悉C++/Python/Java中的一种开发语言,熟悉常用计算机数据结构和算法; 3.熟悉任意机器学习推理训练框架(TensorFlow,PyTorch,MNN等)。理解常用算法的目标函数、优化过程、适用场景; 4.对推荐、广告、NLP等任意领域有较为深入的研究。有知名学术会议及期刊良好发表记录优先; 5.思维清晰,乐于学习新知识,乐于分享。
工作职责
上海方向: 1.开发和优化大模型推理系统。研究面向大语言模型、多模态模型、视觉生成模型的推理加速技术,不限于并行解码、稀疏注意力、采样优化等技术方向。 2.跟踪学术界和工业界的最新推理加速技术,进行分析和优化,推进落地。 3.进行大模型推理加速技术创新,发表高水平论文。 【岗位资源】 1.真实大模型推理加速场景需求、AI大模型推理系统、计算资源 2.与知名高校资深老师团队科研合作,提供例行科研沟通合作机会。 3.业界资深研究员带队技术探索、落地、论文写作发表。 深圳方向: 1. 参与或主导端云协同机器学习算法预研工作,跟进机器学习前沿发展; 2. 参与深度学习模型优化、压缩,设备端算法落地; 3. 指导和参与新技术与理论在实际业务中的落地应用; 4. 参与端云协同系统的研究落地转化,包括系统主要模块算法的设计、验证、实现和上线闭环,并在过程中沉淀对应学术成果。
【岗位职责】 1、开发和优化大模型推理系统。研究面向大语言模型、多模态模型、视觉生成模型的推理加速技术,不限于并行解码、稀疏注意力、采样优化等技术方向。 2、跟踪学术界和工业界的最新推理加速技术,进行分析和优化,推进落地。 3、进行大模型推理加速技术创新,发表高水平论文。
1、领导可扩展、可靠的AI基础设施(AI加速器、计算集群、存储、网络)的端到端设计,用于Training和Inference大模型工作负载; 2、定义并实现面向服务的容器化架构(Kubernetes、VM框架、Unikernels),优化ML性能和安全性; 3、分析和优化ML堆栈的每一层ML编译器、GPU/TPU调度、NCCL/RDMA网络、数据预处理和训练/推理框架,开发低开销Metrics和基准测试框架,以识别和消除分布式训练和Inference中的瓶颈; 4、构建和运营跨多个数据中心(本地和云)自动扩展的大规模部署和编排调度系统,通过智能资源管理和工作负载放置来支持容错、高可用性和成本效益; 5、为PB级大模型数据集量身定制强大的ETL和数据摄取管道(Spark/Beam/Dask/Flume),集成实验管理和工作流编排工具(Airflow、Kubeflow、Metaflow)以简化研究到生产的过程; 6、与机器学习研究人员合作,将原型需求转化为生产级系统,指导工程师在性能调整、系统设计和可靠性工程方面的最佳实践。
【岗位职责】 面向AI搜索、AI检索、智能助理等高价值业务场景,预研和落地AI核心技术,岗位职责包括但不限于: 1.针对AI检索智能体、大推理模型(r1/o1/o3)、多模态特征生成、端侧大模型、多模态检索、AI搜索推荐、检索增强生成(RAG)、个性化内容生成等核心难题,负责研发和突破关键技术。 2.跟踪学术界和工业界最新进展,快速应用到业务中,提出创新AI技术,形成技术影响力。 3.协同核心AI技术的设计以及工程化落地,包括模型设计、特征工程、效率优化等。 【岗位资源】 1.真实大规模搜推广、智能助理业务场景需求、数据、AI开发平台、计算资源。 2.与知名高校资深老师团队科研合作,提供例行科研沟通合作机会。 3.业界资深研究员带队技术探索、落地、论文写作发表。