阿里云阿里云智能-AI异构软硬件结合高级开发工程师-上海
任职要求
1. 具备扎实的工程能力 (C++,Python等); 2. 对GPU(或相关AI加速芯片)系统结构有深入的理解,有实际的开发和性能优化经验; 3. 熟悉主流深度学习框架(例如PyTorch),并对底层实现有较好了解,在模型训练或推理性能优化方面有实操经验; 4. 了解主流大模型的结构与执行细节,了解相关的推理性能优化技术; 5. 具备良好的沟通协作能力和项目组织能力,能与不同背景的团队有…
工作职责
1. 负责研发AI异构计算软件栈,通过结合不同加速芯片的特性,实现AI计算的全链路优化,助力打造在业界具有竞争力的高可靠、高性能、高效率的大规模AI算力基础设施。 2. 结合具体业务场景,开展软硬件协同优化和技术创新(包括但不限于算子优化与编译、量化压缩,计算通讯融合,系统调度、分布式推理优化等工程任务),为实际业务提供卓越的性能和成本效益。 3. 洞察人工智能及深度学习的发展趋势,积极参与下一代AI基础设施的设计与研发。
1. 负责FPGA/芯片产品的架构和系统方案设计,定义软硬件接口和FPGA逻辑架构, 完成逻辑设计和开发、测试、上线、运维等全生命周期的研发工作; 2. 负责相关FPGA/芯片的性能优化和稳定性保障,持续提升多媒体处理硬件方案的性能和稳定性,确保系统安全、稳定、高效运行; 3. 参与多媒体处理等新技术预研和规划,跟踪业务需求和行业技术变化,进行产品规划和FPGA架构演进;包括图像视频生成软硬结合加速技术,推理框架硬件并行加速技术,图像视频编解码硬件加速技术,其它图像处理硬件加速技术等。
方向一: 1.负责针对相机的计算成像的算法原型研发和演进 - 基础图像算法如3R(NoiseReduction, SuperResolution, HDR), 多帧多摄等; - 图像后处理算法如美颜、色彩映射,图像渲染等; - 软硬件结合图像算法如ISP(image signal processor)算法的开发调优、白平衡、自动对焦、自动曝光控制,色彩还原,多摄立体视觉,防抖算法的迭代进化等; 2.AI技术应用影像业务,利用机器学习,深度学习,模型压缩及小型化等前沿技术,解决low-level画质处理,语义理解等多领域核心问题,整体提升用户体验和业务价值; 3.针对android平台和手机soc芯片的图像处理算法架构设计的基础研究,实现全链路影像处理链路的端到端性能最优设计;针对图像/视频效果进行标准定义和定量评测的理论研究; 4.对于前沿技术的动态进行追踪,主导高校产学研合作或供应商技术合作,实现新的影像算法领域探索和技术创新。 方向二: 1.模型性能分析与优化 1)负责影像端侧模型性能分析与调优,包括推理速度、内存占用、功耗等关键指标优化; 2)设计并优化量化、剪枝、蒸馏等模型压缩技术,推动算法在移动端的高效部署; 3)针对GPU/NPU/DSP等硬件特性模型结构,识别模型运行中的瓶颈并提出改进方案,提升端侧推理效率。 2.技术预研与落地 1)跟踪行业前沿技术(如大模型端侧优化、模型压缩等),完成技术验证并推动业务落地; 2)协同算法团队优化模型架构,平衡性能与精度需求。 3)与硬件、系统框架团队合作,优化底层驱动及系统资源调度策略,提升模型运行效率;
1.负责分析硬件加速特征与拓扑结构,研发面向云端AI 硬件服务器的优化算子库,释放硬件潜能,确保性能符合硬件设计预期。 2.结合主流大模型推理框架,研发硬件相关的算子/异步等优化插件,确保优化库快速的被业务集成应用。 3.提供场景化的定制优化能力,识别并解决大模型在不同业务场景下的性能瓶颈,研发满足需求的性能优化组件,并推动业务的应用。
1、参与视觉生成/多模态模型(包括文本、图像、视频生成等)在 GPU、ASIC、FPGA 等异构硬件上的推理/后训练加速开发与软硬件结合的性能优化工作,包括但不限于模型量化、attention优化、显存优化、编译优化、计算与通信优化、内存管理以及多卡或多设备的并行推理方案等; 2、在主流深度学习框架(如 PyTorch)基础上,基于GPU/xPU硬件特点,对关键算子进行软硬件结合优化,提升模型运行效率; 3、与硬件以及算法工程师紧密配合,共同优化整体推理速度与资源占用; 4、跟踪学术界与工业界前沿技术(如扩散模型优化、VAE并行优化、AI编解码、面向机器的编解码等),推动软硬件协同创新。