logo of thead

平头哥平头哥-编译器技术专家-AI软件-上海/北京/杭州

社招全职5年以上技术-芯片地点:上海 | 北京 | 杭州状态:招聘

任职要求


1. 熟练掌握C/C++/Python等编程技能,有扎实的编程基础、良好的编程风格和工作习惯;
2. 熟悉编译原理和算法实现,二年及以上编译器开发经验;
3. 对机器学习算法/深度学习有一定了解尤佳;
4. 有GCCLLVM和Open64等开源编译器相关开发经验尤佳;
5. 有CUDA/OpenCL/汇编级优化经验尤佳;
6. 有深度学习相关框架中如Caffe/Tensorflow/PyTorch/MXNet等图优化开发经验尤佳;
7. 有计算机体系结构背景,熟悉芯片架构/微架构(包括CPU/GPU/SoC/FPGA), 有软硬件协同设计经验尤佳;
8. 具有独立解决问题的能力,良好的团队合作意识和沟通能力;

Requirements:
1. Strong C/C++/Python programming skills and solid knowledge of data structure and algorithm.
2. Familiarity with compiler theory, and experience on compiler devel…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与人工智能芯片的软硬件协同设计,指令集功能验证;
2、参与人工智能芯片的编译器算法设计和实现, 工具链开发与维护,网络模型的性能调优;
3、参与深度学习软件栈的设计和实现;

1. Working closely with hardware/architecture engineering and software teams to understand the hardware and software requirements. 
2. Responsible for compiler and tool chain design, implementation, maintaining and performance tuning.
3. Responsible for the design and implementation of deep learning software stack.
包括英文材料
C+
C+++
Python+
算法+
机器学习+
深度学习+
GCC+
LLVM+
CUDA+
还有更多 •••
相关职位

logo of aliyun
社招3-5年云智能集团

弹性计算异构AI推理团队,承担着构建阿里云IAAS资源在公共云竞争力的职责。在AI领域,团队对接业界主要AI用户的业务需求,承接提升GPU、AI加速器等芯片在AI场景的竞争力职责。和团队一起通过专家领域知识和软硬件分析能力构建阿里云在AI场景的核心竞争力和加速解决方案。 1. 负责基于云上AI真实场景的解决方案和性能分析系统建设,构建性能标尺。 2. 负责基于云上大规模推理场景的构建和底层软件性能优化工作。 3. 负责包括CIPU、GPU、AI加速器等硬件在阿里云AI场景的竞争力构建。 4. 与厂商和内部业务团队合作,为阿里云的AI用户提供具有竞争力的AI解决方案。

更新于 2025-07-15北京|杭州|上海
logo of aligenie
社招8年以上技术-芯片

一、团队管理 ● 负责芯片工具链团队的组建、管理与梯队建设,打造高效能研发团队 ● 制定团队技术路线图,规划产品迭代计划,把控项目进度与质量 ● 建立团队技术规范与研发流程,推动工程效率持续提升 二、产品规划与设计 ● 主导芯片全流程开发工具链的整体架构设计,构建端到端的AI应用开发解决方案 ● 规划并落地以下核心工具模块: ○ 算子开发工具:算子设计、工程创建、单元测试、异常检测、调试调优等全链路工具 ○ 训练开发工具:模型迁移分析、精度调试、性能调优、内存检测等训练场景工具 ○ 推理开发工具:模型量化压缩、推理精度调试、性能调优、负载均衡、Benchmark评测等推理场景工具 ○ 可视化工具:模型结构可视化、训练过程可视化、性能数据可视化分析平台 ○ 诊断分析工具:内存泄漏检测、性能瓶颈分析、精度问题定位等诊断工具 ● 跟踪业界主流AI框架发展趋势,确保工具链的兼容性与易用性 ● 攻克大模型训练与推理场景下的性能优化、精度调试等关键问题的工具设计与研发难题 三、生态建设 ● 与芯片设计、编译器、Runtime等团队紧密协作,推动软硬件协同优化 ● 建立开发者社区,输出技术文档、最佳实践与案例教程,赋能开发者生态

更新于 2026-04-07北京|杭州|上海
logo of ctrip
社招5年以上住宿业务AI &

我们正在寻找一位具有AI智能化及内容算法经验的算法团队负责人。负责领导团队开发前沿技术,推动旅游领域知识的构建,支持内容产品的分发和AI Agent结合的创新应用探索,提升公司产品的智能化水平。 : 领导并管理内容算法团队,制定技术战略和发展方向,推动知识构建、知识编译、知识分发、探索LLM等创新NLP技术与Agent业务的结合。 1、负责基础NLP相关算法研发,面向但不限于:预训练,文本理解,同义词挖掘,实体识别,term权重分析,属性词挖掘 2、结合NLP和深度学习技术,推动领域知识的构建与优化,制定各环节Benchmark及衡量标准, 跟进业界先进大模型、多模态技术的应用及改进 3、发现并解决推荐分发场景中的意图识别、排序模型、相关性等方向的问题,召回策略和召回模型的优化,开发先进和高性能的召回算法 4、与产品、数据、工程等跨职能团队协作,推动技术落地和产品迭代。 5、负责团队成员的技术指导和能力提升,推动团队技术文化的建设。

更新于 2025-04-01上海
logo of kuaishou
社招3-5年J0012

1、参与快手大规模深度学习推理框架的研发与优化,保障在线系统的高可用/高并发,为快手搜索数亿用户提供高效稳定的算力输出; 2、负责快手搜索模型推理优化工作,优化模型推理性能,高吞吐低延时支撑模型推理服务; 3、 支持大模型在搜索场景落地的相关模型优化,包括不局限于AI检索,Query改写等。

更新于 2026-02-25北京