平头哥平头哥-AI 框架技术专家-上海/杭州

社招全职5年以上技术-芯片2026-04-07地点：上海 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 硕士以上，计算机科学相关专业，  至少5+年AI领域相关的开发经验。
2. 熟练掌握Python、C/C++编程语言，掌握AI Vibe Coding技术，良好的逻辑思维与问题分析能力
3. 熟悉SOTA大语言模型、多模态模型、VLA模型的架构与原理
4. 熟悉主流深度学习框架Pytorch、Tensor…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 在AI 芯片上适配SOTA开源框架和SOTA模型，分析解决适配过程中发现的功能、性能与精度问题，为AI芯片客户提供问题支持和解决方案
2. 对SOTA模型和框架做原理分析，竞对分析、构建差异化产品竞争力，贡献开源社区提升产品影响力
3. 构建SOTA模型和框架端到端粒度、算子粒度、Kernel粒度的仿真框架，在芯片设计阶段提前发现精度、性能问题，保障芯片设计成功

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

深度学习+

算法+

大模型+

PyTorch+

TensorFlow+

Megatron+

DeepSpeed+

还有更多 •••

登录查看完整学习资料

相关职位

大模型推理服务（MaaS方向）研发工程师/专家

社招引擎

DirectLLM是小红书内部面向各业务场景建设的大模型API服务产品，通过标准化API接口提供LLM/MLLM等大模型推理服务，致力于为AI应用开发者提供品类丰富、数量众多的模型选择，并通过API接口为其提供开箱即用、能力卓越、成本经济的模型服务，各领域模型的能力均可通过统一的API和SDK来实现被不同业务系统集成。工作职责： 1、参与/负责大模型推理服务平台（MaaS）的架构设计、系统研发、产品研发等工作； 2、深入参与面向大模型场景的请求调度、异构资源调度、引擎优化等核心工作，实现千亿级Token并行推理平台； 3、为内部产品线提供解决方案，协助公司内用户解决大模型应用过程中业务在平台上的使用问题。

北京|上海|深圳

蚂蚁国际-算法专家-ASAP

社招5年以上技术类-算法

蚂蚁国际ASAP技术部正在寻找有激情并且具有创新能力的算法工程师，通过使用AI技术，推动蚂蚁国际化业务的发展。蚂蚁是一家AI驱动的公司，国际化是蚂蚁当前的重点方向，在这个职位上，你有机会接触到互联网金融、人工智能、国际化这3个当前最热门领域。 1.基于跨境支付、跨境游、境外合作钱包等国际业务场景及特点，设计搜索、推荐及营销引流等算法模型及策略，提升用户体验和转化效果，帮助用户增长及商家成长。 2.全面了解蚂蚁国际业务发展，提供基于机器学习、深度学习、联邦学习、大模型、运筹优化等算法方案解决复杂的实际业务问题。

更新于 2025-10-10上海|杭州

优酷-图形/引擎专家工程师-北京/杭州/上海

社招

作为图形、引擎方向的算法工程师，你可以参与到影视CG行业前沿的新技术开发 -负责引擎图形模块的研发，包括但不限于渲染管线、渲染算法、渲染效果、渲染优化等 -负责物理模拟模块的研发，包括但不限于群集模拟、流体模拟、肌肉模拟、布料模拟等 -研究几何、纹理、材质、渲染等SOTA算法，实现高品质路径追踪渲染相关模块 -研究AI与CG的融合工作，如ML Deformer、AI降噪与超分、Data-driven Simulation、逆渲染、高斯喷溅等

更新于 2025-07-16北京|杭州|上海

阿里云智能-深度学习推理系统研发专家-机器学习PAI

社招3年以上云智能集团

● 设计和实现高效的分布式推理架构，提升多节点、多GPU环境下的推理速度和资源利用率。开发智能的请求调度算法，确保高并发场景下的最优响应时间和吞吐量。对推理引擎的运行时环境进行深度优化，减少延迟，提高整体性能。针对多种异构AI加速硬件（如NVIDIA GPU, AMD GPU, NPU等），对核心算子进行极致性能优化，最大化算力和访存带宽利用率。 ● 探索并实现极低bit量化技术和稀疏化，减少模型存储和计算资源消耗，同时保持推理精度。探索更高效的解码算法，提升生成任务的推理速度。 ● 设计并实现能够处理大规模并发请求的系统架构，确保极端负载下的稳定性和性能。引入容错机制、自动恢复和监控报警系统，保证系统的高可用性和稳定性。构建灵活的系统架构，支持动态扩展，以应对未来业务增长和技术演进的需求。 ● 持续关注并跟进业界技术发展，尤其是超长上下文、COT思维链、多模态融合等方向。积极尝试和探索新的推理优化方向，提出并验证创新性的解决方案。

更新于 2025-09-10北京|杭州|上海