logo of didi

滴滴高级算法工程师-LLM(J241010010)

社招全职技术地点:北京状态:招聘

任职要求


1  人工智能、计算机、电子、数学等相关专业毕业,具备扎实的数据结构算法基础,具备良好的数学思维能力。
2  熟悉有关Transfomer、BERTGPT、MoE等方面的知识,对Llama,DeepSeek等大模型框架与其在业务应用、效率提升方面的实践有相关经历。
3 熟悉常用大模型Post-Training方法,包括PEFT、RLHF等相关技术
4  熟悉常用数据挖掘算法及其应用,掌握机器学习算法(如LR、GBDTXGBoost、RL、DNN等),并具备实战经验。
5  编程基础扎实,熟悉至少一种深度学习框架(PytorchTensorFlow),并熟练掌握C++JavaPythonGolang等语言之一。
6  具备优秀的算法设计和实现能力,能够独立完成算法等需求分析、方案设计、代码实现和效果评估。
7  热衷于了解业界前沿技术,洞悉人工智能国际会议的研究动态,具有强烈的钻研精神和主观能动性,能够适应快速变化的技术趋势。


其他优先条件:

有大模型背景和深度学习训练与应用经验者优先
在人工智能相关顶级会议发表过论文者优先
具备ACM/ICPC、CCPC、NOI等经历,编程能力优秀者优先
拥有大型系统架构设计与实践经验者优先
在Kaggle等比赛中取得优异成绩者优先
有英语浏览和书写能力者优先

工作职责


我们是滴滴网约车MPT部门的大模型研究开发团队,致力于以大模型为核心,打通数据、技术与业务链路,推动AI在智能运营与交易市场中的应用革新。我们的研究方向涵盖大模型驱动的数据挖掘、智能运营系统、以及核心交易机制的技术演进。

工作职责与方向包括:

- 负责基于大模型的智能运营系统构建,包括但不限于利用Prompt、SFT、RLHF、Agent等技术,打造面向业务的单点工具建设和产品工具集成。
- 负责基于大模型的交易技术任务和基础技术方案研发,包括但不限于基于大模型的判别式任务构建、基于大模型的基础公共特征挖掘,和交易市场主栈问题(定价、分单)中LLM的应用方案探索。
- 密切关注行业的最新动态,跟踪研究最新技术和趋势,推进有价值的技术在公司内部落地,探索前沿的算法迭代,推动技术创新。
- 与工程团队紧密合作,推动模型的工程化部署,包括模型压缩、推理加速等环节。
包括英文材料
数据结构+
算法+
BERT+
GPT+
Llama+
大模型+
数据挖掘+
机器学习+
GBDT+
XGBoost+
深度学习+
PyTorch+
TensorFlow+
C+++
Java+
Python+
Go+
系统设计+
Kaggle+
相关职位

logo of alibaba
社招2年以上

1. 团队致力于大模型在阿里智能客服场景下的落地使用, 团队内技术氛围浓厚, 拥有先进的大模型落地经验; 2. 在这里你能够接触到海量的售前售后服务域数据,将多轮对话理解、多模态等领域的前沿算法技术转化为智能服务产品的全新体验; 3. 将前沿技术快速应用于实际场景,推动技术方案从实验到落地; 4. 参与跨团队协作,与产品、运营团队共同定义需求,输出可落地的解决方案。

更新于 2025-08-14
logo of tencent
社招5年以上企业微信SaaS

1.负责机器学习模型、深度学习模型在企业微信的落地,包括但不限于对大模型的RL、SFT、强化学习; 2.负责探索与跟进AIGC前沿技术,推动技术框架持续迭代升级,保持行业同类竞品前沿水平; 3.带领团队高效率高质量完成深度学习模型落地。

更新于 2025-09-18
logo of tencent
社招3年以上WXG技术

1.负责机器学习模型、深度学习模型在企业微信的落地,包括但不限于对大模型的RL、SFT、强化学习; 2.负责探索与跟进AIGC前沿技术,推动技术框架持续迭代升级,保持行业同类竞品前沿水平; 3.带领团队高效率高质量完成深度学习模型落地。

更新于 2025-05-23
logo of pingantech
社招计算机网络技术类

1.针对医疗领域特定问题,定义任务流程,收集或构建高质量数据集,对LLM进行微调; 2.利用提示工程、模型微调、调用工具插件等方式完成医疗领域特定应用的探索尝试; 3.尝试提升大语言模型在医疗方面的能力,包括但不限于高效训练、人工反馈对齐、多模态、可控文本生成、生成质量评估,以提升LLM性能。

更新于 2025-04-21