logo of weibo

新浪微博深度学习框架研发工程师

社招全职新浪&微博地点:北京状态:招聘

任职要求


1. 计算机,电子工程,通信等相关专业
2. 熟悉C/C++/Pythonjava编程语言,有扎实的计算机工程基础,有cuda编程实践经验,熟悉相关编译,调试,性能分析工具
3. 学习能力强,有求知欲与自我驱动能力,良好的沟通能力与团队协作能力
4. 有以下经验者优先:
1. 了解搜索,广告,推荐系统,有相关领域算法与工程经验者优先
2. 有高并发服务设计与实践经验,有分布式系统/K8S调度/RPC框架等实践者优先
3. 熟悉GPU/cuDNN/Trition等,有GPU加速优化者经验者优先
4. 熟悉Tensorflow/HugeCtr/PadddlePaddle/Pytorch深度学习框架,有框架二次开发经验者优先
5. 有编译优化相关(tensorRT/XLA/TVM等)相关实践者优先

工作职责


1.负责大规模稀疏模型的训练与推理过程的性能与效率优化,支持CPU/GPU 异构高性能模型工程大规模落地
2.设计与开发机器学习系统,包括数据读取,模型训练,参数存储,模型服务等,搭建上层应用与工作流等
3.协同算法业务团队优化模型效果与训练推理性能
包括英文材料
C+
C+++
Python+
Java+
CUDA+
推荐系统+
算法+
高并发+
分布式系统+
Kubernetes+
RPC+
TensorFlow+
PyTorch+
深度学习+
TensorRT+
相关职位

logo of baidu
社招ACG

-负责基于昆仑芯AI芯片的自动驾驶高性能计算库的开发及算法优化 -负责基于昆仑芯AI芯片的主流自动驾驶模型训练部署和性能优化工作 -负责Pytorch等深度学习框架的定制和性能优化工作 -负责重点客户的自动驾驶训练业务支持工作 -探索基于昆仑芯AI芯片的自动驾驶端到端大模型技术路径

更新于 2025-05-07
logo of tencent
社招1年以上TEG技术

1.参与太极分布式深度学习系统的研发工作,重点负责GPU及异构芯片的适配与性能优化; 2.深入研究框架引擎内部机制,参与或主导前沿大模型相关技术的探索与实践; 3.与团队合作,持续提升系统的稳定性和扩展性,确保系统能够满足大规模深度学习任务的需求。

更新于 2025-05-18
logo of baidu
社招ACG

-结合前沿业务场景,构建昆仑芯AI大规模训练系统 -持续提升系统效能 -主流AI模型对昆仑芯AI芯片的适配和性能优化工作 -探索昆仑芯AI芯片分布式训练方案

更新于 2025-05-07
logo of bytedance
社招A108975

团队介绍:字节跳动豆包大模型团队(Seed)成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 豆包大模型团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责字节跳动机器学习训练框架的研究与开发,服务于全公司各个产品; 2、参与机器学习训练框架底层组件的抽象,设计,优化与落地; 3、与全公司算法部门深度合作,为重点项目进行算法与系统的联合优化。

更新于 2024-05-08