logo of alibaba

阿里巴巴1688-AI Infra工程-杭州

社招全职2年以上地点:杭州状态:招聘

任职要求


1. 熟悉Linux开发环境,熟练掌握PythonC/C++等一种或多种语言;
2. 熟练掌握vllm、sglang、rtp-llm大模型推理加速框架,以及kvcache、pd分离、投机采样等大模型推理加速技术;
3. 熟悉CUDA,有…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


主导/参与1688的AI Infra建设:
1. llm推理框架的研发与优化,训练/强化学习框架的研发与优化,解决1688电商域的模型使用问题;
2. 算法-软件-硬件协同优化(异构并行计算、AI编译、稀疏量化、混部与弹性等),发挥1688集群的计算潜力;
3. 研究业界前沿的AI算法、系统和硬件,探索面大模型AI在线服务或离线批处理的最佳系统。
包括英文材料
Linux+
Python+
C+
C+++
大模型+
vLLM+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术-开发

1. 负责llm后训练训推调优与框架优化,优化负载均衡策略,提升训练和推理效率; 2. 负责rl训练工程环境搭建,包括mcp工具,沙箱,agent等环境,确保其在处理大规模训练时的性能,提高其性能和稳定性; 3. 对设计与实现的功能进行测试和调优,保证其在不同环境下的运行效率。

更新于 2025-09-19杭州
logo of antgroup
社招3年以上技术-开发

1. 负责llm后训练训推调优与框架优化,优化负载均衡策略,提升训练和推理效率; 2. 负责rl训练工程环境搭建,包括mcp工具,沙箱,agent等环境,确保其在处理大规模训练时的性能,提高其性能和稳定性; 3. 对设计与实现的功能进行测试和调优,保证其在不同环境下的运行效率。

更新于 2026-01-15杭州
logo of netease
社招3年以下网易有道

1.结合HPC和AI前沿技术,设计和优化大模型训练和推理框架,负责模型优化、算子优化、图优化、分布式优化等,提升计算效率 2. 负责云侧或端侧大模型和小模型推理服务开发、性能优化、上线等工作

更新于 2025-11-03北京
logo of antgroup
社招1年以上技术类-开发

负责 AI Agent Infra 建设,提升 AI Agent 产品创新效率,探索生成式 AI 在数字世界的实际应用。 1. 建设 Agent SWE Infra 工程,提升 Agent 相关代码的个性化构建和发布效率; 2. 建设 Sandbox Infra 工程,为各类 Agentic 场景提供高效、稳定、大规模的模拟器、多工具、图形交互的沙箱环境; 3. 建设 Serving Infra 工程,为生产提供通用的 Agent 服务化框架,优化 LLM 和 Agent 性能,保障高可用运行。

更新于 2026-01-16北京|杭州