logo of transsion

传音资深后端开发工程师(算法工程化)(J17884)

社招全职4年以上地点:重庆状态:招聘

任职要求


1. 具备4年以上相关领域的工作经验,有推理大模型或大语言模型的设计、研发、部署经验者优先;
2. 熟悉Linux开发环境,掌握Python/C++等语言, 有良好的编程基础、系统设计优化能力;
3. 熟悉各类深度学习网络和算子底层实现细节,训练和推理模型调试、调优有实操经验优先;
4. 熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端 AI 芯片、GPU加速经验优先;
5. 熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先。
6. 熟悉容器化、分布式系统缓存技术、消息队列rpc等相关技术;
7. 具备良好的技术热情和责任感,优秀的分析解决问题能力,良好的团队意识和沟通能力。

工作职责


1. 负责AI 加速硬件的性能评估分析,在单机单卡/大规模集群等场景进行全方位的软硬件系统性能评估,分析调优和业务交付落地;
2. 配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统;
3. 参与过 ASR, TTS 语音工程化落地项目 或参与过 CV 项目.
4. 大模型技术前沿追踪以及框架应用。
5. 深入研究和优化大模型的训练方法,提高模型的效率和效果经验者优先
6. 优化大模型推理性能,提升吞吐并控制成本经验者优先
7. 优化大模型推理框架,提升框架扩展性,易用性和可调试性经验者优先。
包括英文材料
大模型+
Linux+
Python+
C+++
系统设计+
深度学习+
分布式系统+
缓存+
消息队列+
RPC+
相关职位

logo of transsion
社招

负责语音助手产品的需求梳理、后台架构设计与开发。 配合NLP算法工程师,负责对话系统、NLP、LLM Agent工程化建设。 负责语音助手产品的高可用,高性能。

更新于 2025-02-20
logo of sensetime
社招后端开发

AI后端开发工程师的核心任务是为AI能力构建稳定、高效且可扩展的后台服务,确保智能应用顺畅运行。其主要工作包括: ​​1.系统架构设计与优化​​:参与设计​​高并发、低延迟、高可用​​的后端系统架构以支撑AI服务。运用​​微服务、容器化(Docker/K8S)、消息队列(Kafka/RabbitMQ)、缓存(Redis)​​ 等技术,并优化数据库(如MySQL、MongoDB、向量数据库)性能 ​​2.数据处理与管道构建​​:​​构建和维护数据管道​​,支持海量数据的采集、清洗、存储与处理,为模型训练和优化提供支持,有时需设计​​数据闭环​​系统 ​​3.全流程开发与协作​​:参与从​​需求分析、设计、编码、测试到部署运维​​的全流程。需与​​算法工程师、前端工程师、产品经理​​等紧密协作,确保项目顺利交付 ​​4.技术攻坚与创新​​:​​解决模型部署和运行中的技术难题​​(如资源瓶颈、轻量化),​​探索和引入前沿技术​​(如大模型服务化、多模态、边缘计算)以提升产品竞争力

更新于 2025-09-24
logo of bytedance
社招4年以上A193555A

1、负责商业化广告投放系统测试架构的开发,挖掘质量风险,建设保障体系; 2、负责梳理系统存在的问题,包括稳定性,客户体验等,给出可行性方案; 3、改进现有稳定性工具的效率、稳定性和扩展性; 4、参与系统稳定性与容灾相关工作,参与组内产品质量运营和管理工作。

更新于 2025-06-17
logo of ctrip
社招旅游业务开发

参与大规模语言模型(LLM)及其他AI模型的在线服务部署、性能调优与推理加速,确保高并发、低延迟、高可用的模型服务。参与设计和开发智能Agent运行框架,实现核心模块,包括不限于知识库存储与检索(RAG)、Agent的长短期记忆存储、对接多模型协作协议(如MCP/A2A)等新型交互机制。负责搜索推荐算法工程后端系统的设计、开发和维护,保障系统稳定高效运行,实现高并发在线特征工程、模型推理服务集成和服务质量监控等核心模块。参与系统架构的设计、优化及核心模块的代码实现(Java为主)。与产品经理、算法工程师、前端工程师紧密协作,理解需求,设计技术方案并推动落地。负责系统的日常维护、监控、故障排查和性能调优。

更新于 2025-08-26