vivoAI大模型算法架构高级专家
任职要求
1、硕士及以上学历,计算机/电子/自动化/软件等相关专业,有AI大模型工程优化经验的优先; 2、精通C/C++ 及 Python,熟练掌握各类数据结构及相关基础算法; 3、精通GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等; 4、具备丰富的基于CUDA的GPU性能优化经验,同时具备设备端CPU/GPU推理加速经验更佳; 5、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架和推理加速框架,包括Pytorch、TensorRT、TensorRT-LLM、VLLM等; 6、了解主流LLM、Diffusion Model,有LLM、Diffusion Model加速优化经验者优先。
工作职责
1、负责LLM和Diffusion Model的性能优化,基于TensorRT和模型量化剪枝等技术,以及CUDA算子融合重构等性能优化方案,结合业务需求将GPU性能发挥到极致; 2. 负责端云架构下的大模型整体推理优化算法方案研发,通过与算法效果团队深度合作实现云端和设备端算法模块与全系统架构的全面性能优化。
1. 在金融信贷、营销、催收场景下,负责AI-Agent算法架构设计、核心Agent的研发工作。 2、负责大语言模型的后训练与高效学习,应用指令遵循、强化学习、持续学习等,优化对话机器人的响应质量和转化效率 3. 运用大模型、AI-Agent、多模态、声纹和传统机器学习等算法能力,解决生成式AI在金融领域的关键算法问题,深入研究并解决大模型后训练中的效率瓶颈与收敛性问题,提升模型的逻辑、推理、生成能力。 4. 紧跟大模型前沿技术的发展趋势,学习、探索,并落地于业务场景,加速算法迭代,全面提升业务效率。
【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【工作内容】 1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新的技术及其应用场景;解决复杂问题的推理能力scaling up,探索Post-training的前沿技术,如Agent RL、test time learning,并参与research intern的指导,沉淀技术成果,提升部门的AI技术的影响力及AI产品的竞争力,以支撑业务的持续增长。 2、对大模型的效果进行持续调优,通过高效的Post-training手段(SFT、RL等)提升LLM领域模型在业务场景下的表现,支撑通义的AI普惠影响力建设和模型规模化调用。
● 设计和实现高效的训练推理框架,提升多节点、多GPU环境下特别是异构算力场景下的计算效率。具备良好的工程实践和算法理论基础,熟悉底层的硬件编程和常见GPU的算子库开发,能对算法的运行效率如速度、显存占用等进行优化,推动算法稳定、高效的运行。 ● 完善优化训练推理框架,针对市面上的国产信创卡能提出统一的优化方案,并推进在底层的通信效率、资源占用、稳定性方面持续建设。 ● 设计并实现能够处理大规模并发请求的系统架构,确保极端负载下的稳定性和性能。完善错误自愈机制,提升平台训练的MFU,打造行业内一流的异构算力混训混推GPU框架。 ● 技术方案设计:主导核心模块技术方案设计与评审,结合业务需求与系统现状,制定可落地的架构规划。 ● 基础服务开发:构建高可用、可扩展的基础服务组件,支持训练/推理框架的快速迭代与稳定部署。 ● 项目管理:主导跨团队协作项目的全生命周期管理,包括需求拆解、排期规划、进度跟踪与风险控制,确保项目高效交付。 ● 持续关注并跟进业界技术发展,比如超长上下文、端到端推理思维链、多模态等方向。
【岗位描述】 架构设计和工程落地计算机视觉/多模态AI系统,进行下一代驾舱一体AI系统的技术路线规划,确保团队持续产生高质量工程交付和学术预研成果。配合小鹏新一代AI芯片,实现包括但不限于舱外舱内人员与各类开集物体的检测,人体动作和行为的理解与分析,危险动作和场景的预警;车内气氛状态的感知等。 1、模型与算法系统设计:基于最先进的机器学习和神经网络方法算法,开发多模态(图像、视频、文本)模型。 2、技术路线和团队建设:结合产品需求和小鹏AI端/云规划,制定明确的工程技术演进方案和落地计划。确保团队高效运转。 3、创建训练所需的数据集;并根据模型表现以及功能需求,动态筛选、整理与适配数据。 4、实施和优化大模型的分布式训练,提高模型训练的效率和性能。 5、根据相应任务,构建合理的测试数据集,测试视觉语言模型的KPI。 6、与模型部署团队进行沟通,协助模型的转化和部署。 7、实时跟进学术界前沿算法,升级改进数据生成算法与软件。 8、跨团队跨部门沟通协作。