logo of thead

平头哥平头哥-深度学习算法框架高级技术专家-北京

社招全职10年以上技术-芯片地点:北京状态:招聘

任职要求


学历:计算机科学、电子工程、人工智能或相关领域的硕士以上学位。

经验:
至少5年以上深度学习算法研究或框架开发相关工作经验,具有丰富的实际项目经验。
熟悉一种或多种深度学习框架(如 TensorFlowPyTorchKeras 等)的开发和应用。
具备低精度(fp8,int8,fp4 等)量化算法经验

技术能力:
扎实的算法基础和编程能力,熟练掌握 PythonC++ 等编程语言。
深入理解主流深度学习框架Pytorch、Te…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


职位概述:
作为平头哥数据中心产品线深度学习算法框架高级技术专家,将负责设计、开发和优化深度学习算法框架,提升算法模型在PTG AI芯片上的运行效率和性能。跨团队协作,确保高质量的代码和技术实现,同时为团队提供技术指导。

主要职责:
算法框架适配与开发:
对开源AI软件框架的内部实现有深入理解,能够快速将广大开源软件适配到 AI 芯片上,同时确保性能达到最优。同时根据公司AI芯片的差异化的功能,在框架层面实现软硬件结合的解决方案。

性能优化:
分析和优化深度学习模型的训练和推理性能,提升计算效率和资源利用率。
根据芯片硬件特点使用多种技术手段,包括分布式计算、模型压缩和量化,优化算法在实际应用中的表现。

跨团队协作:
与其他团队(如编译器、驱动、客户支持等)紧密合作,确保技术指标的达成,并实现符合用户需求和市场趋势的功能。
为团队成员提供技术指导和支持,推动团队技能的持续提升。

技术研究与创新:
跟踪深度学习和机器学习领域的最新研究动态,探索并实施新算法和技术。
参与编写技术文档和论文,促进技术的分享与传播。
包括英文材料
学历+
深度学习+
算法+
TensorFlow+
PyTorch+
Keras+
Python+
还有更多 •••
相关职位

logo of bytedance
社招A168768

1、负责快速增长的直播业务的推荐算法工作,包含抖音、抖音极速版、抖音火山版、西瓜视频、今日头条等各端直播业务,结合超大规模机器学习系统,构建业界一流领先的推荐系统; 2、负责直播在多场景、全链路的推荐核心算法&策略优化(召回、粗排、精排、混排等等),极致提升个性化直播分发与推荐效率; 3、深入理解用户、主播、平台等生态角色需求,通过持续技术创新与迭代,驱动用户体验、主播成长、平台营收健康持续增长,并通过直播+赋能各垂直行业; 4、和产品、运营团队紧密合作,通过对产品和用户的深入理解和分析,制定算法策略促进直播生态的长期繁荣发展。

更新于 2024-06-03北京
logo of antgroup
社招3年以上技术类-算法

1、负责支付宝数字化风险防控体系能力的建设,包括数字内容、电商商品、短视频、直播互动等领域,应用大模型(不限于LLM、MLLM、AI Agent等)进行风险防控的能力建设; 2、负责支付宝数字化风险领域面向智能领域的全面升级,设计算法解决方案,解决疑难点问题,规划中长期发展路线,推动算法的长期迭代; 3、根据业务场景制定有效的模型训练方案,解决算法领域相关重/难点问题,协同团队达成相关模型的性能指标,创造业务价值和技术价值; 4、不断探索前沿智能技术,进行重点难点技术攻关工作。

更新于 2025-09-16北京|杭州
logo of quark
社招3年以上

1、主导大模型在线推理系统的性能攻坚,构建多节点多GPU的分布式推理架构,实现智能请求调度算法与异构硬件的极致性能调优; 2、研究低bit量化、稀疏化attention等解码加速技术,在保障精度前提下显著降低计算资源消耗; 3、设计高并发场景下的负载均衡方案,构建支持动态扩展的弹性计算架构,优化推理引擎运行时环境,实现毫秒级延迟与高QPS吞吐能力。

更新于 2025-11-30北京|杭州
logo of didi
社招技术

1.负责多模态大模型全链路研发与优化,涵盖 SFT、RL 训练等关键环节,探索图文、视频、音频等多模态数据的质量评估与清洗方法、优化模型训练策略及结构设计、提升模型泛化与推理能力。 2.结合业务场景需求,主导多模态大模型落地项目,涵盖内容理解与结构化、质量甄别、智能生成等任务,设计算法方案并推动上线,提升业务效率与用户体验。 3.跟踪多模态大模型前沿技术,探索其在安全治理场景的适配性和落地,驱动技术迭代。 4.承担团队管理与人才培养,提升团队技术影响力。

更新于 2025-11-06北京