logo of oppo

OPPO后端工程师(大模型推理系统)

社招全职3-5年SOFTWARE地点:深圳状态:招聘

任职要求


1.本科及以上学历,1年以上工作经验,具备扎实的工程基础,熟练掌握PythonC++CUDA数据结构和基础算法。
2.熟悉主流大模型架构,具备较强的编程能力,能承担项目模块的具体开发工作。
3.熟悉vLLM/SGLang/TensorRT/Pytorch深度学习框架,具备大模型训练或推理加速经验优先。
4.有大型模型并行部署和调优经验优先。
5.具备优秀的逻辑思维和问题解决能力

工作职责


岗位职责:
1.负责大模型推理系统的设计与开发,支持云上LLM、多模态语言模型推理业务。
2.负责深度优化大模型推理引擎性能,降低引擎推理延迟,提升引擎吞吐。
3.负责建设和维护大模型推理服务以及建设服务的稳定性。
包括英文材料
学历+
Python+
C+++
CUDA+
数据结构+
算法+
大模型+
vLLM+
SGLang+
TensorRT+
PyTorch+
深度学习+
相关职位

logo of transsion
社招4年以上

1. 负责AI 加速硬件的性能评估分析,在单机单卡/大规模集群等场景进行全方位的软硬件系统性能评估,分析调优和业务交付落地; 2. 配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统; 3. 参与过 ASR, TTS 语音工程化落地项目 或参与过 CV 项目. 4. 大模型技术前沿追踪以及框架应用。 5. 深入研究和优化大模型的训练方法,提高模型的效率和效果经验者优先 6. 优化大模型推理性能,提升吞吐并控制成本经验者优先 7. 优化大模型推理框架,提升框架扩展性,易用性和可调试性经验者优先。

更新于 2025-04-16
logo of bytedance
社招A97431A

1、负责大模型基建相关研发,包括不限于PE、RAG、插件、大模型数据系统、大模型训练、大模型安全、大模型评估等基础能力建设; 2、参与并负责C端大模型应用落地,包括抖音、今日头条、剪映等业务的大模型项目建设; 3、持续探索在各个业务场景下使用大模型能力优化产品体验、提升研发效率; 4、关注大模型前沿技术,跟进业内最新研究进展和应用趋势,提出创新思路和方向。

更新于 2024-07-18
logo of baidu
社招2年以上ACG

-负责百度千帆大模型平台模型服务工程相关系统的开发和支持,推理服务架构稳定性、性能优化、扩展性技术研发 -参与大模型的国产芯片适配、推理加速与优化工作,参与深度学习前沿加速技术研究 -将AI前沿技术应用到各个垂直行业,负责相关应用工程配套开发 -根据需求文档进行相关产品的开发,撰写开发文档,对负责的产品做好客户支持工作

更新于 2025-10-17
logo of meituan
社招1年以上核心本地商业-基

美团基础研发平台,作为公司的核心技术平台,致力于“零售+科技”的战略发展。我们专注于智能体构建、大模型推理、多模态训练等核心技术,并通过FRIDAY模型工厂与应用工厂,为业务提供稳定、安全、易扩展的平台技术和模型能力。 我们真诚邀请你加入我们,共同推动技术发展,创造行业价值。 负责多智能体系统的设计与开发,提升智能体在复杂环境中的协作和决策能力。 推进工具调用能力的研发,使智能体能够灵活调用外部工具和API,以扩展其功能。 开发智能体的思考能力,包括但不限于逻辑推理、规划、学习和自适应能力。 负责智能体产品解决方案的建设,推动算法在业务场景中的落地,赋能商家入驻、企业办公、风控合规、自动化测试等业务的智能化升级。 负责智能体服务部署落地全流程,以及构建流程自动化系统。

更新于 2025-06-22