logo of oppo

OPPO后端工程师(大模型推理系统)

社招全职3-5年SOFTWARE地点:深圳状态:招聘

任职要求


1.本科及以上学历,1年以上工作经验,具备扎实的工程基础,熟练掌握PythonC++CUDA数据结构和基础算法。
2.熟悉主流大模型架构,具备较强的编程能力,能承担项目模块的具体开发工作。…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


岗位职责:
1.负责大模型推理系统的设计与开发,支持云上LLM、多模态语言模型推理业务。
2.负责深度优化大模型推理引擎性能,降低引擎推理延迟,提升引擎吞吐。
3.负责建设和维护大模型推理服务以及建设服务的稳定性。
包括英文材料
学历+
Python+
C+++
CUDA+
数据结构+
算法+
还有更多 •••
相关职位

logo of transsion
社招4年以上

1. 负责AI 加速硬件的性能评估分析,在单机单卡/大规模集群等场景进行全方位的软硬件系统性能评估,分析调优和业务交付落地; 2. 配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统; 3. 参与过 ASR, TTS 语音工程化落地项目 或参与过 CV 项目. 4. 大模型技术前沿追踪以及框架应用。 5. 深入研究和优化大模型的训练方法,提高模型的效率和效果经验者优先 6. 优化大模型推理性能,提升吞吐并控制成本经验者优先 7. 优化大模型推理框架,提升框架扩展性,易用性和可调试性经验者优先。

更新于 2025-04-16重庆
logo of bytedance
社招A97431A

1、负责大模型基建相关研发,包括不限于PE、RAG、插件、大模型数据系统、大模型训练、大模型安全、大模型评估等基础能力建设; 2、参与并负责C端大模型应用落地,包括抖音、今日头条、剪映等业务的大模型项目建设; 3、持续探索在各个业务场景下使用大模型能力优化产品体验、提升研发效率; 4、关注大模型前沿技术,跟进业内最新研究进展和应用趋势,提出创新思路和方向。

更新于 2024-07-18北京
logo of sf
社招10年以上

1. 主导现有物流系统AI化升级的整体后端架构设计,结合业务场景制定技术选型方案(如微服务/云原生架构),规划大模型集成、Agent调度的分层架构,保障系统扩展性与兼容性。 有成功落地经验、个人作品者优先; 2. 设计企业知识库的分布式架构,基于Python/Java技术栈搭建多源数据接入层、向量检索层与服务封装层,解决高并发下的数据同步与检索性能问题,输出架构设计文档。 3. 负责AI Agent核心架构落地,设计多智能体协作框架(如基于事件驱动/服务调用模式),定义Agent通信协议与状态管理机制,规避系统耦合风险,保障架构稳定性。 4. 主导架构评审与技术难点攻关,定期评估AI化架构适配性,输出架构演进方案,协调跨团队资源推进落地,确保系统AI化升级符合业务长期发展需求。

更新于 2025-12-04武汉
logo of baidu
社招2年以上ACG

-负责百度千帆大模型平台模型服务工程相关系统的开发和支持,推理服务架构稳定性、性能优化、扩展性技术研发 -参与大模型的国产芯片适配、推理加速与优化工作,参与深度学习前沿加速技术研究 -将AI前沿技术应用到各个垂直行业,负责相关应用工程配套开发 -根据需求文档进行相关产品的开发,撰写开发文档,对负责的产品做好客户支持工作

更新于 2025-10-17上海|成都