影石服务端高性能计算工程师
社招全职地点:上海 | 深圳状态:招聘
任职要求
1.统招本科及以上学历,计算机、软件工程、通信工程、电子信息工程、自动化等专业优先 2.掌握计算机体系结构,掌握c++ 3.有gpu/simd/asm开发经验的优先 4.…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责AI及传统图像、视频算法工程化 2.负责各个算法在特定处理器上的极致优化,包括但不限于指令集、cache、带宽、GPU优化 3.负责分析各个算法的性能瓶颈点,并与算法同事进行反馈,进一步保效提速降负载 4.负责算法SDK的封装,输出到下游部门进行集成,并进行性能和效果对齐
包括英文材料
学历+
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Perf+
https://perfwiki.github.io/main/
perf is powerful: it can instrument CPU performance counters, tracepoints, kprobes, and uprobes (dynamic tracing).
https://www.brendangregg.com/bpf-performance-tools-book.html
This book can help you get the most out of your systems and applications, helping you improve performance, reduce costs, and solve software issues.
[英文] perf Examples
https://www.brendangregg.com/perf.html
These are some examples of using the perf Linux profiler, which has also been called Performance Counters for Linux (PCL), Linux perf events (LPE), or perf_events.
https://www.youtube.com/watch?v=M6ldFtwWup0
还有更多 •••
相关职位
社招D4137
参与数字人直播/智能体互动的AI推理和高性能计算调度架构的设计,参与AIGC diffuision加速,以及流媒体高性能优化等关键技术研究及核心代码开发,更好的服务数字人AIGC业务。
更新于 2025-06-20北京
校招大模型
大模型AI Infrastructure团队专注于大语言模型领域的前沿技术研究和落地,提供高性能、高可靠、可扩展的机器学习系统、丰富的异构计算资源和极致的端到端的机器学习服务体验,为公司提供核心技术能力和服务。 1、负责机器学习框架的研究与开发,服务于公司各个产品; 2、高效部署,优化NLP/多模态大模型核心业务模型。
更新于 2025-09-06北京|上海
社招1年以上技术类
1、负责机器学习平台的设计和开发,包括模型训练、在线推理、高性能KV平台等系统; 2、设计、开发超大规模机器学习系统,优化现有技术方案,改善系统性能, 提高算法的整体迭代效率; 3、与业务团队积极沟通和合作,帮助业务更快的落地, 并持续优化和改进;
更新于 2025-08-08上海