平头哥平头哥-深度学习算法框架高级技术专家-北京
社招全职10年以上技术-芯片地点:北京状态:招聘
任职要求
学历:计算机科学、电子工程、人工智能或相关领域的硕士以上学位。 经验: 至少5年以上深度学习算法研究或框架开发相关工作经验,具有丰富的实际项目经验。 熟悉一种或多种深度学习框架(如 TensorFlow、PyTorch、Keras 等)的开发和应用。 具备低精度(fp8,int8,fp4 等)量化算法经验 技术能力: 扎实的算法基础和编程能力,熟练掌握 Python、C++ 等编程语言。 深入理解主流深度学习框架Pytorch、Te…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
职位概述: 作为平头哥数据中心产品线深度学习算法框架高级技术专家,将负责设计、开发和优化深度学习算法框架,提升算法模型在PTG AI芯片上的运行效率和性能。跨团队协作,确保高质量的代码和技术实现,同时为团队提供技术指导。 主要职责: 算法框架适配与开发: 对开源AI软件框架的内部实现有深入理解,能够快速将广大开源软件适配到 AI 芯片上,同时确保性能达到最优。同时根据公司AI芯片的差异化的功能,在框架层面实现软硬件结合的解决方案。 性能优化: 分析和优化深度学习模型的训练和推理性能,提升计算效率和资源利用率。 根据芯片硬件特点使用多种技术手段,包括分布式计算、模型压缩和量化,优化算法在实际应用中的表现。 跨团队协作: 与其他团队(如编译器、驱动、客户支持等)紧密合作,确保技术指标的达成,并实现符合用户需求和市场趋势的功能。 为团队成员提供技术指导和支持,推动团队技能的持续提升。 技术研究与创新: 跟踪深度学习和机器学习领域的最新研究动态,探索并实施新算法和技术。 参与编写技术文档和论文,促进技术的分享与传播。
包括英文材料
学历+
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
Keras+
https://keras.io/getting_started/intro_to_keras_for_engineers/
Keras 3 is a deep learning framework works with TensorFlow, JAX, and PyTorch interchangeably.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
还有更多 •••
相关职位
社招A168768
1、负责快速增长的直播业务的推荐算法工作,包含抖音、抖音极速版、抖音火山版、西瓜视频、今日头条等各端直播业务,结合超大规模机器学习系统,构建业界一流领先的推荐系统; 2、负责直播在多场景、全链路的推荐核心算法&策略优化(召回、粗排、精排、混排等等),极致提升个性化直播分发与推荐效率; 3、深入理解用户、主播、平台等生态角色需求,通过持续技术创新与迭代,驱动用户体验、主播成长、平台营收健康持续增长,并通过直播+赋能各垂直行业; 4、和产品、运营团队紧密合作,通过对产品和用户的深入理解和分析,制定算法策略促进直播生态的长期繁荣发展。
更新于 2024-06-03北京
社招3年以上技术类-算法
1、负责支付宝数字化风险防控体系能力的建设,包括数字内容、电商商品、短视频、直播互动等领域,应用大模型(不限于LLM、MLLM、AI Agent等)进行风险防控的能力建设; 2、负责支付宝数字化风险领域面向智能领域的全面升级,设计算法解决方案,解决疑难点问题,规划中长期发展路线,推动算法的长期迭代; 3、根据业务场景制定有效的模型训练方案,解决算法领域相关重/难点问题,协同团队达成相关模型的性能指标,创造业务价值和技术价值; 4、不断探索前沿智能技术,进行重点难点技术攻关工作。
更新于 2025-09-16北京|杭州
社招3年以上
1、主导大模型在线推理系统的性能攻坚,构建多节点多GPU的分布式推理架构,实现智能请求调度算法与异构硬件的极致性能调优; 2、研究低bit量化、稀疏化attention等解码加速技术,在保障精度前提下显著降低计算资源消耗; 3、设计高并发场景下的负载均衡方案,构建支持动态扩展的弹性计算架构,优化推理引擎运行时环境,实现毫秒级延迟与高QPS吞吐能力。
更新于 2025-11-30北京|杭州