滴滴高级 Go/ Python研发工程师 (模型训练)(JR2026020400K)
任职要求
1,计算机科学、软件工程、电子工程等相关专业本科及以上学历
2,计算机基础扎实,深入理解操作系统、网络、常用数据结构和算法,具备复杂系统调试和优化能力
3,熟练掌握Golang和Python,具备扎实的编码能力以及良好的代码风格
4,熟悉机器学习完整生命周期(数据收集、特征工程、模型训练、评…工作职责
滴滴核心的国际化交易市场架构方向,负责机器学习平台,特征生产以及模型推理服务的研发工作 1,负责机器学习平台的需求分析、架构设计以及核心代码实现,重点覆盖资源调度、自动化训练流程、模型部署与服务化、性能监控等关键模块。 2,主导平台在高并发场景下的性能调优,解决大规模分布式训练任务中的稳定性与效率瓶颈,提升GPU等异构计算资源的利用率。 3,设计与开发提升算法研发效能的内部工具、SDK等,降低平台使用门槛,支持从数据准备到模型上线的完整MLOps流程。
【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性
1、负责模型训练平台核心功能开发和架构设计,包括传统CN/NLP/SD/LLM等多场景支持 2、负责大模型后训练工具平台化建设,包括后预训练、微调、对齐等技术落地 3、设计和实现高性能分布式训练系统,打造端到端训练解决方案 4、优化训练调度和资源管理,提升集群利用率和训练效率 5、开发模型训练监控诊断工具,建设可观测性体系
-负责营销SaaS产品数字员工智能体应用的需求调研、设计及研发落地工作,结合已有的外呼、客服等应用产品,推动AI Agent在营销、客户服务等To B垂直领域落地并取得业务价值 -负责营销场景售前线索收集、售中对话分析、售后客服等场景化Agent技术预研、架构设计、业务模型抽象及功能开发保持对业务场景的敏锐洞察,快速熟悉业务流程并理解业务痛点,沟通并分析产品需求,制定技术方案,设计与研发核心系统及模块,推动产品快速迭代 -负责AI Agent框架设计与实现,构建高可用、低延迟的AI Agent生产环境。探索大模型与Agent技术的结合,解决复杂场景下的推理能力 -优化Agent与工具调用的协同机制,提升任务规划、自主决策和交互体验,构建各场景化Agent的自动化评估系统