logo of ymtc

长江存储AI存储专家(Storage AI Expert)(J14566)

社招全职地点:武汉状态:招聘

任职要求


1. 计算机、电子工程、软件工程、人工智能、存储系统等相关专业研究生及以上学历
2. 熟悉 Linux 系统,具备良好的问题定位、性能分析和实验验证能力。
3. 熟悉 PythonC/C++Shell 中至少一种编程语言,能够进行实验脚本开发、数据分析和原型验证。
4. 理解 Transformer、大模型推理流程、Attention、KV Cache、Prefill / Decode、上下文窗口、Batching 等基本概念。
5. 熟悉至少一种主流大模型推理框架的部署和使用调优,如 vLLM、SGLang、llama.cpp、TensorRT-LLM、Ollama、KTransformers 等。
6. 有开源大模型部署、量化、推理优化、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 跟踪主流大模型生态与开源模型发展,包括 Qwen、DeepSeek、Kimi、GLM、LLaMA、Gemma 等模型方向。
2. 研究大模型在 GPU 服务器/AI PC/边缘设备等平台上的部署,性能瓶颈分析与调优。
3. 基于 vLLM、SGLang、llama.cpp、Ollama、KTransformers、TensorRT-LLM 等推理框架,分析模型推理过程中的计算、显存、内存与存储需求。
4. 研究存储相关的关键AI领域技术,包括 KV Cache 的生成、访问、复用、卸载和回读机制,及分层卸载方案,PD分离架构对存储需求,长上下文推理,及超高性能SSD等领域,推导产品核心需求,并于上下游合作制定产品架构和技术路线图。
5. 主导面向AI新产品架构方向的技术预研、需求定义,并驱动产业上游。
6. 跟踪 GPU Direct Storage、GPU Initiated Storage、CXL、NVMe、OCP等AI领域相关技术与标准演进,  评估对产品影响并提出相关标准提案和建议。。
7.面向 AI 工作负载分析和针对性优化
包括英文材料
学历+
Linux+
Python+
C+
C+++
Bash+
脚本+
数据分析+
还有更多 •••