小鹏汽车AI引擎高级/资深研发工程师
任职要求
1. 硕士研究生及以上学历,计算机及相关专业;3年以上工作经验 2. 有扎实的数据结构与算法基础,精通c/c++; 3. 熟悉transformer等主流模型结构,熟悉gpu/npu编程,有一定的cuda开发和优化经验 4. 熟悉基础语音交互算法(包括但不限于asr,nlp,tts或者多模大模型应用)或者有语音交互引擎研发经验者优先; 5. 有TensorRT-llm,vLLM等大模型推理部署使用和开发经验者优先
工作职责
1. 参与语音交互算法工程化工作(包括但不限于asr,nlp,tts,多模大模型)关联模块及端到端的架构设计和功能开发; 2. 多平台(如GPU,高通8155/8295芯片平台)的模型推理优化及加速;
【】 - 主导设计与研发:负责基于大语言模型(LLM)的核心信息解析引擎,聚焦于深层语义理解、意图识别与多模态知识抽取。 - 构建前沿模型:架构并实现业界领先的NLP算法模型,持续优化模型性能,挑战信息提取任务在准确性、效率与泛化能力上的极限(SOTA)。 - 探索技术边界:追踪并引入NLP及AIGC领域的前沿技术(如RAG、Fine-tuning策略、AI Agent等),探索其在业务场景中的创新应用,构建公司技术护城河。 - 垂域探索:探索大语言模型(LLM)在酒店垂域下的推荐应用。 - 驱动技术落地:与产品、工程团队紧密协作,推动算法方案从原型验证到生产环境的完整生命周期,确保技术方案的稳定、高效与可扩展性。 【
1、主导AI客服系统架构设计,集成大模型、知识库、工单系统及内部工具(如版权库、曲库API),实现用户问题自动分类、意图识别和智能路由,实现用户求助满意度提升; 2、搭建多智能体(Multi-Agent)协作框架,设计客服场景下Agent工作流(如:意图理解Agent、故障诊断Agent、投诉处理Agent),支持跨系统工具调用(MCP、Function Call等); 3、构建客服对话记忆管理、实时决策引擎及服务追踪(Tracing)体系,实现复杂会话状态的持续优化; 4、负责RAG(检索增强生成)系统工程化落地,结合音乐知识库(版权规则、产品文档、歌曲信息等)提升回答准确性; 5、设计客服Agent 反思(Self-Reflection)与思维链(Chain-of-Thought)机制,提升复杂问题处理能力; 6、构建故障诊断推理引擎:基于用户反馈(如“歌曲无法播放”“耳机断连”)以及关联信息,实现自动根因分析; 7、主导系统性能优化与保障,提升千万用户客服体验。

1、主要负责游戏新功能模块的程序设计和开发; 2、优化游戏性能; 3、客户端工具链开发优化; 4、游戏客户端技术方案优化; 5、配合策划实现游戏功能,确保程序开发进度。