logo of tencent

腾讯存储AI训练推理加速研发工程师(深圳/上海)

社招全职5年以上CSIG技术地点:成都 | 深圳状态:招聘

任职要求


1.本科及以上学历,5年及以上工作经验,有高性能存储系统研发经验,对Lustre、GPFS、GlusterFS等有深刻理解和丰富实战经验;
2.具备良好的系统分析能力,良好的抽象思维和逻辑思维能力,独立分析问题解决问题的能力;
3.具有优秀的学习能力、沟通能力、服务意识和团队合作精神;
4.强烈的责任心和主动性,对工作有强烈的所有权意识,并能自我激励以实现个人和团队成长。

加分项
1.具有5年以上并行文件系统的研发经验;
2.拥有高性能计算存储系统建设实践经验优先。

工作职责


1.完善HPC,基因计算,自动驾驶,AI大模型训练等领域的解决方案;
2.参与相关场景高性能文件系统的客户需求对接、产品优化和问题解决;
3.拓展文件系统生态,例如与对象存储数据互通, 对接容器等。
包括英文材料
学历+
相关职位

logo of aliyun
实习阿里云2026届

阿里云持续推进AI技术深化战略布局,围绕AI和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正在招募软硬件结合开发工程师,致力于打造下一代智能化软硬件一体化解决方案。 作为软硬件结合开发工程师,你将参与从底层硬件设计到上层软件优化的全流程研发工作,推动AI、云计算和大数据技术在高性能计算、异构计算等领域的创新与落地。具体职责包括但不限于以下方向: 岗位职责 1. 软硬件协同优化 负责软硬件协同设计,优化计算性能、能耗效率和系统稳定性。 针对特定应用场景(如AI推理、分布式存储、实时计算等),设计并实现高效的软硬件解决方案。 2. 基于FPGA/ASIC芯片的设计与开发 参与FPGA/ASIC芯片的设计与验证,包括算法映射、硬件架构设计和性能调优。 开发硬件抽象层(HAL)和相关工具链,支持硬件加速器与上层软件的无缝集成。 参与硬件加速器及系统仿真模型的开发和调试。 3. 计算平台底层软件开发 研发基于CPU、GPU、FPGA、ASIC等硬件的计算平台,提升AI训练和推理等业务的计算性能。 基于自研芯片平台,进行驱动和固件等开发,支持深度学习框架等软件在硬件平台上高效运行。 4. 操作系统与固件开发 优化Linux内核、设备驱动和固件,提升硬件资源利用率和系统响应速度。 开发针对特定硬件的定制化操作系统模块,满足高性能计算需求。 5. 开发者工具与生态建设 开发软硬件结合的开发者工具链(如SDK、CLI、IDE插件),降低开发门槛。 构建开放的技术生态,推动软硬件一体化解决方案的广泛应用。

更新于 2025-04-29
logo of xiaohongshu
校招机器学习平台

小红书中台AI平台团队致力于打造业界领先的一站式AI平台,通过技术创新和工程优化,为公司AI业务发展提供强有力的基础设施支撑,实现算法研发效率的显著提升和成本的有效控制。我们负责调度公司所有AI模型训练及推理的数万卡GPU资源,基于自研的训练、推理、智能体框架,为公司所有算法及工程同学提供端到端、一站式的AI研发能力,包含大模型数据处理/训练/压缩/推理/部署及开箱即用的API体验、AI知识库/智能体应用构建、搜广推数据生产/模型训练/模型上线/特征管理/模型测试等。 1、负责大模型/搜广推模型开发平台、AI应用开发平台的架构设计和核心功能研发,构建云原生架构,设计高可用、高性能的微服务体系; 2、负责构建面向大模型、搜广推、智能体全流程DevOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地; 3、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、GPU虚拟化、存储&网络加速等手段,提升GPU集群使用效率; 4、将平台和框架结合,通过任务调度、弹性容灾、性能优化等措施端到端提升AI生产效率,涉及k8s/kubeflow、网络通信、分布式训练等; 5、优化各AI平台性能,提升系统稳定性和可扩展性,保障大规模并发场景下的服务质量与用户体验; 6、持续研究分析业内创新AI平台产品,优化技术方案,改进产品功能,提升创新能力与产品体验。

更新于 2025-09-24
logo of xiaohongshu
校招机器学习平台

小红书中台AI平台团队致力于打造业界领先的一站式AI平台,通过技术创新和工程优化,为公司AI业务发展提供强有力的基础设施支撑,实现算法研发效率的显著提升和成本的有效控制。我们负责调度公司所有AI模型训练及推理的数万卡GPU资源,基于自研的训练、推理、智能体框架,为公司所有算法及工程同学提供端到端、一站式的AI研发能力,包含大模型数据处理/训练/压缩/推理/部署及开箱即用的API体验、AI知识库/智能体应用构建、搜广推数据生产/模型训练/模型上线/特征管理/模型测试等。 1、负责大模型/搜广推模型开发平台、AI应用开发平台的架构设计和核心功能研发,构建云原生架构,设计高可用、高性能的微服务体系; 2、负责构建面向大模型、搜广推、智能体全流程DevOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地; 3、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、GPU虚拟化、存储&网络加速等手段,提升GPU集群使用效率; 4、将平台和框架结合,通过任务调度、弹性容灾、性能优化等措施端到端提升AI生产效率,涉及k8s/kubeflow、网络通信、分布式训练等; 5、优化各AI平台性能,提升系统稳定性和可扩展性,保障大规模并发场景下的服务质量与用户体验; 6、持续研究分析业内创新AI平台产品,优化技术方案,改进产品功能,提升创新能力与产品体验。

更新于 2025-09-24
logo of oppo
校招AI/算法类

方向一: 1. 负责多模态大模型的基础能力提升,图文多模态模型的下游算法研究,图文多模态技术在AI搜索、图片结构化提取、图片内容理解等应用领域云侧和端侧的研究等 2. 跟进业界前沿技术,持续提升团队在图文多模态算法方面的技术积累。 方向二: 1. 负责多模态大模型压缩算法研发,探索并实现极低bit量化技术和稀疏化技术,保持推理精度的同时减少模型存储和计算资源消耗;多模态大模型编解码加速算法研发,降低端侧模型推理成本; 2. 参与端侧大模型技术体系建设,探索和实现高效大模型架构,开发和优化内部模型端侧化部署工具链,跟进大模型前沿技术发展趋势,探索相关算法的创新优化,发表高质量研究论文。 方向三: 1. 参与AI搜索,小布记忆等业务交付中的算法方案设计,模型训练等,持续提升算法能力,改善产品体验; 方向四: 1、 负责参与小布助手统一意图理解与任务编排的算法及数据工程优化 方向五: 1. 参与个性化大模型算法设计、实现和优化,提升模型用户特征提取、行为挖掘及精准画像等核心能力; 2. 协同产品与工程团队,推动个性化大模型在手机业务中的创新应用,持续探索技术突破点并推动团队技术迭代,保持行业领先性。

更新于 2025-07-14