logo of didi

滴滴用户平台部(1)算法实习生

实习兼职技术类地点:北京状态:招聘

任职要求


1.计算机/AI/大数据相关专业本科或硕士在读,至少可实习 3 个月、每周至少 3 天。
2.熟练Linux 常用命令、PythonPyTorch、SQL
3.熟悉 NLP 基础任务,了…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


工作内容:
深入参与构建大模型 Agent 高质量数据合成飞轮,构建多维度自动评估体系链路闭环。

具体工作:
1.针对业务场景设计基于LLM大模型的多轮对话数据合成链路,构建高质量数据合成pipeline以及线上自进化数据飞轮。
2.基于业务场景抽象用户画像,设计可插拔的画像策略,实现支持多轮对话策略的自动交互,兼顾可控性与多样性。
3.参与设计建设自动化评估,实时监控数据质量与模型效果。
包括英文材料
大数据+
Linux+
Python+
PyTorch+
还有更多 •••
相关职位

logo of didi
实习技术类

【大模型训练实习生】 工作内容: 深入参与垂类场景Agent大模型的预训练和后训练,构建领域对话大模型。 具体工作: 1.支持预训练和后训练任务,并在导师指导下完成 PPO/DPO/GRPO 等算法应用及改进,支持大模型分布式训练实验。 2.协助构建奖励模型:偏好数据清洗、特征工程、鲁棒性测试,跟踪实验指标及可视化分析。 3.驱动效果闭环:搭建离线多维度指标与在线 A/B 体系,打造自迭代数据飞轮。

更新于 2025-08-05北京
logo of didi
实习算法类

Agent开发工程师 工作内容: 智能客服场景的Agent设计、开发,提升机器人服务质量、效率。 具体内容: 1.针对单轮、多轮任务设计合适的Agent架构(如ReACT/Reflexion/Multi-Agent) 2.根据反馈数据,优化Agent设计模式,持续进化。 3.基于Bad Case训练模型,提升Agent的理解、思考、决策、工具调用能力

更新于 2025-08-04北京
logo of didi
实习算法类

大模型训练工程师 工作内容: 深入参与垂类场景Agent大模型的预训练和后训练,构建领域对话大模型。 具体内容: 1. 支持预训练和后训练任务,并在导师指导下完成 PPO/DPO/GRPO 等算法应用及改进,支持大模型分布式训练实验。 2. 协助构建奖励模型:偏好数据清洗、特征工程、鲁棒性测试,跟踪实验指标及可视化分析。 3. 驱动效果闭环:搭建离线多维度指标与在线 A/B 体系,打造自迭代数据飞轮。

更新于 2025-08-04北京
logo of didi
实习算法类

利用滴滴海量的真实出行轨迹数据、机器学习和深度学习技术,对滴滴司乘轨迹行为模式、路网通行性等进行建模,相关项目可以迅速应用到实际场景(路网更新、司机异常行为检测等)中,提升滴滴用户的出行体验和平台效率。

更新于 2025-12-02北京