logo of thead

平头哥平头哥-AI 框架技术专家-上海/杭州

社招全职5年以上技术-芯片地点:上海 | 杭州状态:招聘

任职要求


1. 硕士以上,计算机科学相关专业,  至少5+年AI领域相关的开发经验。
2. 熟练掌握Python、C/C++编程语言,掌握AI Vibe Coding技术,良好的逻辑思维与问题分析能力
3. 熟悉SOTA大语言模型、多模态模型、VLA模型的架构与原理
4. 熟悉主流深度学习框架Pytorch、Tensor…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 在AI 芯片上适配SOTA开源框架和SOTA模型,分析解决适配过程中发现的功能、性能与精度问题,为AI芯片客户提供问题支持和解决方案
2. 对SOTA模型和框架做原理分析,竞对分析、构建差异化产品竞争力,贡献开源社区提升产品影响力
3. 构建SOTA模型和框架端到端粒度、算子粒度、Kernel粒度的仿真框架,在芯片设计阶段提前发现精度、性能问题,保障芯片设计成功
包括英文材料
深度学习+
算法+
大模型+
PyTorch+
TensorFlow+
Megatron+
DeepSpeed+
还有更多 •••
相关职位

logo of xiaohongshu
社招引擎

DirectLLM是小红书内部面向各业务场景建设的大模型API服务产品,通过标准化API接口提供LLM/MLLM等大模型推理服务,致力于为AI应用开发者提供品类丰富、数量众多的模型选择,并通过API接口为其提供开箱即用、能力卓越、成本经济的模型服务,各领域模型的能力均可通过统一的API和SDK来实现被不同业务系统集成。 工作职责: 1、参与/负责大模型推理服务平台(MaaS)的架构设计、系统研发、产品研发等工作; 2、深入参与面向大模型场景的请求调度、异构资源调度、引擎优化等核心工作,实现千亿级Token并行推理平台; 3、为内部产品线提供解决方案,协助公司内用户解决大模型应用过程中业务在平台上的使用问题。

北京|上海|深圳
logo of antgroup
社招5年以上技术类-算法

蚂蚁国际ASAP技术部正在寻找有激情并且具有创新能力的算法工程师,通过使用AI技术,推动蚂蚁国际化业务的发展。蚂蚁是一家AI驱动的公司,国际化是蚂蚁当前的重点方向,在这个职位上,你有机会接触到互联网金融、人工智能、国际化这3个当前最热门领域。 1.基于跨境支付、跨境游、境外合作钱包等国际业务场景及特点,设计搜索、推荐及营销引流等算法模型及策略,提升用户体验和转化效果,帮助用户增长及商家成长。 2.全面了解蚂蚁国际业务发展,提供基于机器学习、深度学习、联邦学习、大模型、运筹优化等算法方案解决复杂的实际业务问题。

更新于 2025-10-10上海|杭州
logo of youku
社招

作为图形、引擎方向的算法工程师,你可以参与到影视CG行业前沿的新技术开发 -负责引擎图形模块的研发,包括但不限于渲染管线、渲染算法、渲染效果、渲染优化等 -负责物理模拟模块的研发,包括但不限于群集模拟、流体模拟、肌肉模拟、布料模拟等 -研究几何、纹理、材质、渲染等SOTA算法,实现高品质路径追踪渲染相关模块 -研究AI与CG的融合工作,如ML Deformer、AI降噪与超分、Data-driven Simulation、逆渲染、高斯喷溅等

更新于 2025-07-16北京|杭州|上海
logo of aliyun
社招3年以上云智能集团

● 设计和实现高效的分布式推理架构,提升多节点、多GPU环境下的推理速度和资源利用率。开发智能的请求调度算法,确保高并发场景下的最优响应时间和吞吐量。对推理引擎的运行时环境进行深度优化,减少延迟,提高整体性能。针对多种异构AI加速硬件(如NVIDIA GPU, AMD GPU, NPU等),对核心算子进行极致性能优化,最大化算力和访存带宽利用率。 ● 探索并实现极低bit量化技术和稀疏化,减少模型存储和计算资源消耗,同时保持推理精度。探索更高效的解码算法,提升生成任务的推理速度。 ● 设计并实现能够处理大规模并发请求的系统架构,确保极端负载下的稳定性和性能。引入容错机制、自动恢复和监控报警系统,保证系统的高可用性和稳定性。构建灵活的系统架构,支持动态扩展,以应对未来业务增长和技术演进的需求。 ● 持续关注并跟进业界技术发展,尤其是超长上下文、COT思维链、多模态融合等方向。积极尝试和探索新的推理优化方向,提出并验证创新性的解决方案。

更新于 2025-09-10北京|杭州|上海