logo of thead

平头哥平头哥-深度学习算法框架高级技术专家-北京

社招全职10年以上技术-芯片地点:北京状态:招聘

任职要求


学历:计算机科学、电子工程、人工智能或相关领域的硕士以上学位。

经验:
至少5年以上深度学习算法研究或框架开发相关工作经验,具有丰富的实际项目经验。
熟悉一种或多种深度学习框架(如 TensorFlowPyTorchKeras 等)的开发和应用。
具备低精度(fp8,int8,fp4 等)量化算法经验

技术能力:
扎实的算法基础和编程能力,熟练掌握 PythonC++ 等编程语言。
深入理解主流深度学习框架PytorchTensorflow 的内部实现原理;
理解分布式训练框架Megatron-LM、DeepSpeed 的特性,对大模型训练的5D 并行策略有深入理解;
熟悉大模型推理框架VLLMSGLang等,并能够根据芯片硬件资源做性能优化;
具有AI相关软件开源社区工作经验者优先;
具有强化学习领域相关经验者优先;

个人素质:
具备较强的分析和解决问题的能力,良好的团队沟通和协作能力。
具有创新思维和自主学习能力,能够在快速变化的技术环境中保持领先。

工作职责


职位概述:
作为平头哥数据中心产品线深度学习算法框架高级技术专家,将负责设计、开发和优化深度学习算法框架,提升算法模型在PTG AI芯片上的运行效率和性能。跨团队协作,确保高质量的代码和技术实现,同时为团队提供技术指导。

主要职责:
算法框架适配与开发:
对开源AI软件框架的内部实现有深入理解,能够快速将广大开源软件适配到 AI 芯片上,同时确保性能达到最优。同时根据公司AI芯片的差异化的功能,在框架层面实现软硬件结合的解决方案。

性能优化:
分析和优化深度学习模型的训练和推理性能,提升计算效率和资源利用率。
根据芯片硬件特点使用多种技术手段,包括分布式计算、模型压缩和量化,优化算法在实际应用中的表现。

跨团队协作:
与其他团队(如编译器、驱动、客户支持等)紧密合作,确保技术指标的达成,并实现符合用户需求和市场趋势的功能。
为团队成员提供技术指导和支持,推动团队技能的持续提升。

技术研究与创新:
跟踪深度学习和机器学习领域的最新研究动态,探索并实施新算法和技术。
参与编写技术文档和论文,促进技术的分享与传播。
包括英文材料
学历+
深度学习+
算法+
TensorFlow+
PyTorch+
Keras+
Python+
C+++
Megatron+
DeepSpeed+
大模型+
vLLM+
SGLang+
强化学习+
相关职位

logo of bytedance
社招A168768

1、负责快速增长的直播业务的推荐算法工作,包含抖音、抖音极速版、抖音火山版、西瓜视频、今日头条等各端直播业务,结合超大规模机器学习系统,构建业界一流领先的推荐系统; 2、负责直播在多场景、全链路的推荐核心算法&策略优化(召回、粗排、精排、混排等等),极致提升个性化直播分发与推荐效率; 3、深入理解用户、主播、平台等生态角色需求,通过持续技术创新与迭代,驱动用户体验、主播成长、平台营收健康持续增长,并通过直播+赋能各垂直行业; 4、和产品、运营团队紧密合作,通过对产品和用户的深入理解和分析,制定算法策略促进直播生态的长期繁荣发展。

更新于 2024-06-03
logo of antgroup
社招3年以上技术类-算法

1、负责支付宝数字化风险防控体系能力的建设,包括数字内容、电商商品、短视频、直播互动等领域,应用大模型(不限于LLM、MLLM、AI Agent等)进行风险防控的能力建设; 2、负责支付宝数字化风险领域面向智能领域的全面升级,设计算法解决方案,解决疑难点问题,规划中长期发展路线,推动算法的长期迭代; 3、根据业务场景制定有效的模型训练方案,解决算法领域相关重/难点问题,协同团队达成相关模型的性能指标,创造业务价值和技术价值; 4、不断探索前沿智能技术,进行重点难点技术攻关工作。

更新于 2025-09-16
logo of quark
社招3年以上技术类-开发

1、主导大模型在线推理系统的性能攻坚,构建多节点多GPU的分布式推理架构,实现智能请求调度算法与异构硬件的极致性能调优; 2、研究低bit量化、稀疏化attention等解码加速技术,在保障精度前提下显著降低计算资源消耗; 3、设计高并发场景下的负载均衡方案,构建支持动态扩展的弹性计算架构,优化推理引擎运行时环境,实现毫秒级延迟与高QPS吞吐能力。

更新于 2025-09-30
logo of eleme
社招5年以上技术类-算法

1. 负责饿了么营销定价算法,包括骑手补贴、定价、活动等优化; 2. 负责骑手全生命周期体验与成长,促进拉新和留存; 3. 参与营销创新性算法的研究及开发工作; 4. 协同业务进行跨团队合作。

更新于 2025-10-17