平头哥平头哥-深度学习算法框架高级技术专家-北京
社招全职10年以上技术-芯片地点:北京状态:招聘
任职要求
学历:计算机科学、电子工程、人工智能或相关领域的硕士以上学位。 经验: 至少5年以上深度学习算法研究或框架开发相关工作经验,具有丰富的实际项目经验。 熟悉一种或多种深度学习框架(如 TensorFlow、PyTorch、Keras 等)的开发和应用。 具备低精度(fp8,int8,fp4 等)量化算法经验 技术能力: 扎实的算法基础和编程能力,熟练掌握 Python、C++ 等编程语言。 深入理解主流深度学习框架Pytorch、Tensorflow 的内部实现原理; 理解分布式训练框架Megatron-LM、DeepSpeed 的特性,对大模型训练的5D 并行策略有深入理解; 熟悉大模型推理框架VLLM、SGLang等,并能够根据芯片硬件资源做性能优化; 具有AI相关软件开源社区工作经验者优先; 具有强化学习领域相关经验者优先; 个人素质: 具备较强的分析和解决问题的能力,良好的团队沟通和协作能力。 具有创新思维和自主学习能力,能够在快速变化的技术环境中保持领先。
工作职责
职位概述: 作为平头哥数据中心产品线深度学习算法框架高级技术专家,将负责设计、开发和优化深度学习算法框架,提升算法模型在PTG AI芯片上的运行效率和性能。跨团队协作,确保高质量的代码和技术实现,同时为团队提供技术指导。 主要职责: 算法框架适配与开发: 对开源AI软件框架的内部实现有深入理解,能够快速将广大开源软件适配到 AI 芯片上,同时确保性能达到最优。同时根据公司AI芯片的差异化的功能,在框架层面实现软硬件结合的解决方案。 性能优化: 分析和优化深度学习模型的训练和推理性能,提升计算效率和资源利用率。 根据芯片硬件特点使用多种技术手段,包括分布式计算、模型压缩和量化,优化算法在实际应用中的表现。 跨团队协作: 与其他团队(如编译器、驱动、客户支持等)紧密合作,确保技术指标的达成,并实现符合用户需求和市场趋势的功能。 为团队成员提供技术指导和支持,推动团队技能的持续提升。 技术研究与创新: 跟踪深度学习和机器学习领域的最新研究动态,探索并实施新算法和技术。 参与编写技术文档和论文,促进技术的分享与传播。
包括英文材料
学历+
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
Keras+
https://keras.io/getting_started/intro_to_keras_for_engineers/
Keras 3 is a deep learning framework works with TensorFlow, JAX, and PyTorch interchangeably.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Megatron+
https://www.youtube.com/watch?v=hc0u4avAkuM
DeepSpeed+
https://www.youtube.com/watch?v=pDGI668pNg0
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
vLLM+
https://www.newline.co/@zaoyang/ultimate-guide-to-vllm--aad8b65d
vLLM is a framework designed to make large language models faster, more efficient, and better suited for production environments.
https://www.youtube.com/watch?v=Ju2FrqIrdx0
vLLM is a cutting-edge serving engine designed for large language models (LLMs), offering unparalleled performance and efficiency for AI-driven applications.
SGLang+
[英文] Install SGLang
https://docs.sglang.ai/get_started/install.html
SGLang is a fast serving framework for large language models and vision language models.
https://github.com/sgl-project/sgl-learning-materials
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
相关职位
社招A168768
1、负责快速增长的直播业务的推荐算法工作,包含抖音、抖音极速版、抖音火山版、西瓜视频、今日头条等各端直播业务,结合超大规模机器学习系统,构建业界一流领先的推荐系统; 2、负责直播在多场景、全链路的推荐核心算法&策略优化(召回、粗排、精排、混排等等),极致提升个性化直播分发与推荐效率; 3、深入理解用户、主播、平台等生态角色需求,通过持续技术创新与迭代,驱动用户体验、主播成长、平台营收健康持续增长,并通过直播+赋能各垂直行业; 4、和产品、运营团队紧密合作,通过对产品和用户的深入理解和分析,制定算法策略促进直播生态的长期繁荣发展。
更新于 2024-06-03
社招3年以上技术类-算法
1、负责支付宝数字化风险防控体系能力的建设,包括数字内容、电商商品、短视频、直播互动等领域,应用大模型(不限于LLM、MLLM、AI Agent等)进行风险防控的能力建设; 2、负责支付宝数字化风险领域面向智能领域的全面升级,设计算法解决方案,解决疑难点问题,规划中长期发展路线,推动算法的长期迭代; 3、根据业务场景制定有效的模型训练方案,解决算法领域相关重/难点问题,协同团队达成相关模型的性能指标,创造业务价值和技术价值; 4、不断探索前沿智能技术,进行重点难点技术攻关工作。
更新于 2025-09-16
社招3年以上技术类-开发
1、主导大模型在线推理系统的性能攻坚,构建多节点多GPU的分布式推理架构,实现智能请求调度算法与异构硬件的极致性能调优; 2、研究低bit量化、稀疏化attention等解码加速技术,在保障精度前提下显著降低计算资源消耗; 3、设计高并发场景下的负载均衡方案,构建支持动态扩展的弹性计算架构,优化推理引擎运行时环境,实现毫秒级延迟与高QPS吞吐能力。
更新于 2025-09-30