阿里巴巴阿里妈妈-广告引擎异构计算研发实习生

实习兼职淘天集团研究型实习生2025-05-06地点：北京状态：招聘

扫码手机上打开

任职要求

1. 熟练掌握C++编程语言（+Python基础），数据结构、算法基础扎实，熟悉Linux编程，对性能优化、架构设计有深入的学习和了解；
2. 了解检索引擎基本原理、了解GPU硬件编程、了解常见大模型（LLM）结构和优化思路，有异构计算具体经验；
3. 熟悉CU…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 跟进GPU范式下向量化召回的极致优化、大语言模型（LLM）推理加速优化、异构硬件优化技术，跟进搜推广引擎架构GPU范式设计和落地；
2. 基于前沿调研和团队输入，优化落地海量物料供给下的GPU向量化召回、召回引擎业务逻辑异构计算抽象和落地、LLM推理延时/吞吐优化；
3. 结合上述研究和具体工作，撰写技术文章，和业界、学界形成良好交流。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

C+++

Python+

数据结构+

算法+

Linux+

还有更多 •••

登录查看完整学习资料

相关职位

高性能计算研发实习生-广告业务

实习A256950

ByteIntern：面向2026届毕业生（2025年9月-2026年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：广告业务原为商业产品与技术部门，为抖音集团的商业变现提供广告产品与技术，负责端到端大型广告系统建设，覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵，践行“激发生意新可能”理念，致力于让营销更省心、更高效、更美好，推动商业的可持续增长，让不分体量、地域的企业及个体，都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里，你将投身建设面向未来的数字营销能力，接触到全球先进的商业产品架构、模型和算法，在互联网广告行业始终创新。 1、针对广告/推荐/搜索等场景，优化模型训练/推理的计算图执行效率； 2、通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术，打造业界领先的高性能训推引擎； 3、设计和开发高性能算子库，研究最新的GPU计算技术和优化方法，以充分利用GPU/NPU的并行计算能力，支持各种机器学习和深度学习模型的构建和部署； 4、负责机器学习系统前瞻技术的调研和引入，例如最新硬件架构、异构计算系统、GPU优化技术、编译优化技术的引入和落地。

更新于 2025-02-26北京

高性能计算研发实习生-Data AML

实习A185540C

ByteIntern：面向2026届毕业生（2025年9月-2026年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：Data AML是字节跳动公司的机器学习中台，为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力，并在这些业务的问题上研究一些具有通用性和创新性的算法。同时，也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外，AML还在AI for Science，科学计算等领域做一些前沿研究。 1、负责机器学习训练和推理系统的研发与性能优化，包括但不限于：超大模型计算性能优化、千卡训练集群调优、分布式推理系统、大规模推理流量调度等； 2、负责解决大规模AI系统中高并发、高可靠性、高可扩展性等技术难关，支撑公司内外千万客户流量需求； 3、负责大模型训练和推理前瞻性技术架构的调研和引入，技术方案不限于分布式训推系统、子图匹配、编译优化、模型量化等； 4、负责异构硬件的引入与训练推理框架的集成，包括但不限于GPU、NPU、TPU等； 5、面向全球多地域超大规模GPU算力集群，通过弹性调度、GPU 超卖、任务编排等方式不断提升算力利用率； 6、与算法部门深度合作，分析性能瓶颈，通过软硬结合提升模型训推效率，支持AI工具链和技术生态建设，推动公司AI关键业务发展。

更新于 2025-02-14杭州

高性能计算研发实习生-Data AML

实习A180875

更新于 2025-02-14上海

高性能计算研发实习生-Data AML

实习A52031

更新于 2025-02-14北京