快手【快Star-X实习】AI架构与引擎工程师
任职要求
1、本科及以上学历,计算机相关专业优先; 2、熟练掌握C/C++,代码风格良好,熟悉计算机体系结构和数据结构; 3、热爱…
工作职责
1、负责快手自研深度学习开发框架和推理引擎的设计、实现和优化,包括模型压缩量化、异构计算、AI模型与推理引擎的联合设计等; 2、负责AI算法的工程化落地,包括SDK架构、性能优化等工作;提升工程化流程的模块化、平台化、自动化水平,提高落地效率和工程质量。
1、负责依据不同业务场景的特点和新硬件特性,结合系统软硬件栈的整体调优,提出并实施性能优化方案; 2、负责持续跟踪业内软硬件相关领域的技术发展趋势,结合不同业务场景未来需求,开展方案预研以及推广应用工作。 具体包括以下两种场景或者两种之一: 1)AI计算相关场景,例如:大模型训练场景,AIGC、NLP、推荐等常规推理场景; 2)以容器云、大数据计算平台为例的通用计算平台场景。

你将做什么 作为 AI SoC 底层软件方向的实习生,你将在导师带领下参与以下工作: 1. 参与自研 ARM64 AI SoC 的底层软件开发 - Linux / QNX 驱动与系统软件开发 - 与 AI 相关的关键模块:内存、I/O、Boot、安全、性能相关基础设施 2. 为 AI 芯片提供“稳定、可控、高性能”的底层支撑 - 编写和调试底层 C 代码 - 通过寄存器配置、内核机制让硬件稳定工作 - 理解 AI 算力背后的数据通路与系统瓶颈 3. 参与芯片早期软件验证 - 在仿真模型 / FPGA 原型平台上进行驱动验证 - 学习如何在“硬件还不完善”的情况下写软件 4. 参与芯片 Bring-up 与问题定位 - 学习如何从串口日志、寄存器状态、异常信息中定位问题 - 理解真实芯片启动与运行过程中发生的一切 5. 逐步独立负责小型模块或功能点 - 从简单外设到系统级功能 - 覆盖:驱动代码、文档、调试脚本等完整链路
1、负责研发基于diffusion的low-level视频处理算法,专注于提升算法性能,包括但不限于网络架构设计、算法优化、大规模数据处理以及Diffusion模型保真性提升; 2、负责研发基于diffusion的视频压缩和生成框架,致力于突破视频生成极限,涉及图像/视频压缩算法的创新设计和优化; 3、持续关注并分析国际前沿的AI技术动态,将最新的处理及编解码技术融入现有模型,为研发下一代基于AI的高效视频处理系统提供技术基础。