logo of didi

滴滴大模型数据工程师(J250328013)

社招全职技术地点:北京状态:招聘

任职要求


1. 计算机科学、数据科学自然语言处理等相关专业硕士及以上学历;
2. 扎实的编程功底,熟练掌握TensorFlow/PyTorch深度学习框架,熟悉Python/C++等主流编程语言;
3. 熟练掌握大数据处理工具,如SparkFlinkRay等;了解GPU加速相关技术,具有良好的算法设计能力,能够从工程角度思考模型效果优化方案;
4. 熟悉大模型训练流程,熟悉Transformer模型结构,对GPTMoE/Qwen/Deepseek等模型架构和应用有比较深入理解;
5. 熟悉常用数据采集框架和工具库firecrawl,beautifulsoup,selenium, crawley使用;
6. 责任心强,积极主动,能独立思考,具有好奇心和快速学习能力,有良好的沟通能力和团队合作能力;

工作职责


1. 构建端到端的网页文本内容提取&分析系统,针对网络数据复杂性,从系统效率和模型效果角度持续优化网页内容提取算法,迭代线上生产标准;
2. 设计预训练数据全局质量优化和治理方案,优化数据采样策略、隐私保护和安全合规策略,提升基座模型训练效率和效果;
3. 深度参与和实现多模态(图文混合、语音等)交错数据处理pipline,通过数据分析和配比实验等手段,提升多模态数据质量和多样性,支撑多模态大模型的数据需求;
4. 跟进大模型数据领域前沿技术(如Data Influence、Curriculum Learning、数据合成、基于大模型的数据预处理等),推动数据驱动的模型性能突破;
5. 深度参与千亿级网页的大规模处理和万亿级token数据生产,通过分布式计算、模型量化及显存优化的方式提升数据处理和生产效率;
包括英文材料
数据科学+
NLP+
学历+
TensorFlow+
PyTorch+
深度学习+
Python+
C+++
Spark+
Ray+
算法+
大模型+
Transformer+
Selenium+
相关职位

logo of didi
社招技术

1、参与客服toC的热线网络电话、大模型相关的多模态技术建设 2、负责音视频数据的稳定可靠传输 3、持续打磨音视频产品的交互体验和通信质量

更新于 2025-07-25
logo of didi
社招技术

负责支持大模型在出行业务场景中的高效落地。主要任务包括海量数据处理和高可用服务架构的设计与实现。 1. 参与滴滴大模型核心业务相关的系统架构设计与开发,构建面向海量数据与复杂计算的系统; 2. 支持大模型在出行业务场景中的工程化应用,涉及智能推荐、策略优化、动态调度等功能的架构设计与开发; 3. 深入理解业务需求,与出行业务团队紧密协作,为多场景、多区域提供定制化的工程解决方案; 4. 确保核心服务的高可用性和稳定性,通过技术创新持续优化系统性能和可靠性; 5. 跟踪并研究前沿技术,推动AI技术在滴滴大模型业务中的创新和应用。

更新于 2025-06-09
logo of didi
社招3年以上技术

1. 负责滴滴L-lab进攻方向大模型产品的业务迭代,保障项目研发质量、交付周期、产品稳定性、产品可用性; 2. 协同产品和设计团队,针对大模型产品的特点高效开发,保证交付体验; 3. 持续改善现有技术框架,提升工程效率,适应业务发展;

更新于 2025-08-07
logo of didi
社招5年以上技术

滴滴国际化Fintech业务,是滴滴国际化战略的重要组成板块。其支付业务,已经覆盖了全球十多个国家,在中国互联网公司出海中出类拔萃。 自2021年开始,滴滴Fintech在拉美地区大力发展电子支付和信贷业务。短短2年时间,其个人信贷业务,已经在墨西哥的Fintech玩家中位于第一梯队;其电子钱包业务也在巴西的Fintech玩家中也名列前茅,实现快速增长。此外,滴滴Fintech还在拉美地区积极探索和开展信用卡、商户收单等业务,为当地用户带来更便捷、优质、更高性价比的金融服务,实现多个从0到1的突破。 我们诚挚邀请真诚、 可靠、勇于挑战的您和我们一起,携手并肩,拥抱金融出海的浪潮。和滴滴Fintech一起,实现从0到1,从1到100的快速成长 职位描述: 1、参与并完成风控平台基建研发,包括决策引擎、特征平台、核身、模型、名单、图数据库、监控平台、Databus等多个方向 2、建设提效工具,提升风控研发流程的效率。 3、积极跟其他团队沟通和配合,推动项目进展,讨论并提出有建设性的意见。

更新于 2025-03-19