logo of weibo

新浪微博深度学习研发工程师

社招全职新浪&微博地点:北京状态:招聘

任职要求


1. 计算机基础扎实,熟悉C/C++/Python,具备系统软件开发架构能力。熟悉计算机体系结构以及并行计算基本技术
2.有CUDA编程实践经验,熟悉相关编译调试、性能分析及优化
3.学习能力强,有求知欲与自我驱动能力,良好的沟通能力与团队协作能力
4.有以下经验者优先:
1)有高并发服务设计与实践经验,有分布式系统/K8S调度/RPC框架等实践者…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责公司深度学习平台及引擎开发,为业务提供CPU/GPU高性能计算引擎
2.设计开发深度学习系统,协同算法团队优化模型效果与训练推理性能
包括英文材料
C+
C+++
Python+
CUDA+
高并发+
分布式系统+
Kubernetes+
还有更多 •••
相关职位

logo of netease
社招网易伏羲

1、算法研究: 围绕大规模/AIGC场景研究业界算法动态,实践相关算法,对基础的算法效果和能力进行改进。 2、模型优化:结合量化剪枝等相关算法优化技术,降低推理延时及成本,突破新技术在新场景的应用边界。 3、工程优化: 拥抱开源生态,保持洞察。充分挖掘系统和数据的优势,结合操作系统、分布式、芯片特性探索的工程落地可能。 4、成果交付: 从业务出发,重点面向文本、语音、图像等多种模态、构建高效的SDK或智能体方案,为业务提供出色、稳定的技术支持。

更新于 2025-06-17杭州
logo of deepseek
社招DeepSeek

1. 既懂算法又懂系统; 2. 既能调精度也能调性能; 3. 既考虑训练也考虑推理部署。

更新于 2026-01-20杭州|北京
logo of bytedance
社招A166830

1、参与抖音&国际化短视频搜索场景下机器学习和深度学习架构的设计与实现; 2、关注文本相关性模型、多模态、Wide&Deep模型、LLM模型等深度学习模型在搜索场景中的性能和成本优化; 3、提高模型训练效率,加速推理性能,优化GPU吞吐; 4、设计和开发高性能算子库,研究最新的GPU计算技术和优化方法,充分利用GPU并行计算能力,支持各种模型在不同硬件上的构建和部署。

更新于 2024-10-11上海
logo of bytedance
社招A171872A

1、参与抖音&国际化短视频搜索场景下机器学习和深度学习架构的设计与实现; 2、关注文本相关性模型、多模态、Wide&Deep模型、LLM模型等深度学习模型在搜索场景中的性能和成本优化; 3、提高模型训练效率,加速推理性能,优化GPU吞吐; 4、设计和开发高性能算子库,研究最新的GPU计算技术和优化方法,充分利用GPU并行计算能力,支持各种模型在不同硬件上的构建和部署。

更新于 2024-10-11北京