传音资深后端开发工程师(算法工程化)(J17884)
任职要求
1. 具备4年以上相关领域的工作经验,有推理大模型或大语言模型的设计、研发、部署经验者优先; 2. 熟悉Linux开发环境,掌握Python/C++等语言, 有良好的编程基础、系统设计优化能力; 3. 熟悉各类深度学习网络和算子底层实现细节,训练和推理模型调试、调优有实操经验优先; 4. 熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端 AI 芯片、GPU加速经验优先; 5. 熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先。 6. 熟悉容器化、分布式系统、缓存技术、消息队列、rpc等相关技术; 7. 具备良好的技术热情和责任感,优秀的分析解决问题能力,良好的团队意识和沟通能力。
工作职责
1. 负责AI 加速硬件的性能评估分析,在单机单卡/大规模集群等场景进行全方位的软硬件系统性能评估,分析调优和业务交付落地; 2. 配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统; 3. 参与过 ASR, TTS 语音工程化落地项目 或参与过 CV 项目. 4. 大模型技术前沿追踪以及框架应用。 5. 深入研究和优化大模型的训练方法,提高模型的效率和效果经验者优先 6. 优化大模型推理性能,提升吞吐并控制成本经验者优先 7. 优化大模型推理框架,提升框架扩展性,易用性和可调试性经验者优先。

AI后端开发工程师的核心任务是为AI能力构建稳定、高效且可扩展的后台服务,确保智能应用顺畅运行。其主要工作包括: 1.系统架构设计与优化:参与设计高并发、低延迟、高可用的后端系统架构以支撑AI服务。运用微服务、容器化(Docker/K8S)、消息队列(Kafka/RabbitMQ)、缓存(Redis) 等技术,并优化数据库(如MySQL、MongoDB、向量数据库)性能 2.数据处理与管道构建:构建和维护数据管道,支持海量数据的采集、清洗、存储与处理,为模型训练和优化提供支持,有时需设计数据闭环系统 3.全流程开发与协作:参与从需求分析、设计、编码、测试到部署运维的全流程。需与算法工程师、前端工程师、产品经理等紧密协作,确保项目顺利交付 4.技术攻坚与创新:解决模型部署和运行中的技术难题(如资源瓶颈、轻量化),探索和引入前沿技术(如大模型服务化、多模态、边缘计算)以提升产品竞争力
1、负责商业化广告投放系统测试架构的开发,挖掘质量风险,建设保障体系; 2、负责梳理系统存在的问题,包括稳定性,客户体验等,给出可行性方案; 3、改进现有稳定性工具的效率、稳定性和扩展性; 4、参与系统稳定性与容灾相关工作,参与组内产品质量运营和管理工作。
参与大规模语言模型(LLM)及其他AI模型的在线服务部署、性能调优与推理加速,确保高并发、低延迟、高可用的模型服务。参与设计和开发智能Agent运行框架,实现核心模块,包括不限于知识库存储与检索(RAG)、Agent的长短期记忆存储、对接多模型协作协议(如MCP/A2A)等新型交互机制。负责搜索推荐算法工程后端系统的设计、开发和维护,保障系统稳定高效运行,实现高并发在线特征工程、模型推理服务集成和服务质量监控等核心模块。参与系统架构的设计、优化及核心模块的代码实现(Java为主)。与产品经理、算法工程师、前端工程师紧密协作,理解需求,设计技术方案并推动落地。负责系统的日常维护、监控、故障排查和性能调优。