logo of tesla

特斯拉资深算法工程师,模型后训练

社招全职2年以上AI与数据分析地点:上海状态:招聘

任职要求


1. 学历背景: 计算机科学、人工智能、数学或相关领域的本科及以上学历。
2. 核心经验:
o 具备至少2年以上的AI模型训练相关经验,拥有完整的大模型(如LLaMA, Qwen等)微调项目落地经验者优先。
o 具备LLM应用开发经验,并有RAGAgent Multi-agent等应用的实际落地经验。
3. 技术栈掌握:
o 精通 Python,并熟练掌握至少一种主流深度学习框架(PyTorch为佳)。
o 熟悉 Hugging Face 生态,对 Transformers, PEFT, Accelerate等库有深入的实践经验。
o 熟悉模型训练的各个环节,包括数据构建、分布式训练技术、模型量化与推理优化。
4. 硬件与环境: 具备在多GPU环境下进行模型训练的经验,熟悉NVIDIA GPU、CUDA和NCCL等相关技术。
5. 软实力:
o 优秀的分析和解决问题…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


随着AI技术在公司核心业务中的深度应用,我们发现通用的提示词工程已难以满足我们对高精度、高效率的业务指标要求。与此同时,业界小尺寸基础模型的成熟为我们通过微调(Fine-tuning)打造专属、高效的AI模型提供了绝佳契机。
为抓住这一机遇,我们正在寻找一位在AI模型训练与应用开发领域均拥有丰富实战经验的复合型工程师。您不仅需要主导模型微调的技术路线与实践,利用即将到位的本地化尖端硬件资源,打造高性能的定制化模型;更需要具备将强大模型能力转化为创新应用的能力,打通从模型到产品的全链路,直接驱动业务价值的提升。

岗位职责:

1. 模型微调与训练: 负责大语言模型(LLM)或多模态模型的微调工作,包括但不限于指令微调(SFT)、基于人类反馈的强化学习(RLHF)、LoRA/QLoRA等高效微调技术的实践与优化。
2. 技术方案设计: 针对具体的业务场景,设计并实施从数据准备、模型选型、训练策略到效果评估的全流程微调方案。
3. 训练平台搭建与优化: 负责在新的本地化硬件集群(多GPU服务器)上搭建、配置和优化模型训练环境,确保训练任务的高效、稳定运行。
4. LLM应用开发与集成:
o 参与或主导基于大模型的应用开发,包括但不限于构建检索增强生成(RAG)系统、开发智能体(Agent)应用。
o 将微调后的模型封装为高效稳定的API服务,并与现有业务系统进行集成。(加分项)
5. 性能评估与迭代: 建立科学的模型与应用评估体系,持续跟踪模型在精确度、响应速度、业务效果等方面的表现,并进行快速迭代优化。
6. 技术探索与创新: 紧跟AI模型训练与应用领域的前沿技术动态,研究和引入最新的框架、算法和工具,持续提升团队的技术实力。
包括英文材料
学历+
大模型+
Llama+
RAG+
AI agent+
Python+
还有更多 •••
相关职位

logo of bytedance
社招A84868

1、主导SFT(监督微调)、DPO(直接偏好优化)、RL(强化学习)等大模型后训练算法的研究与开发,优化模型训练流程,提升模型在各类任务中的性能与表现,增强模型的泛化能力和适应性; 2、负责Coding、翻译、多模态等垂直领域大模型的全流程研发工作,包括需求分析、模型架构设计、数据处理、模型训练与评估,打造贴合行业场景需求的专属大模型解决方案; 3、持续跟踪行业最新技术动态,结合公司业务需求,对现有大模型算法和垂直领域模型进行优化与迭代,解决模型训练和应用过程中的技术难题,提升模型的效率和质量; 4、与数据、产品、工程等团队紧密配合,参与从数据准备、算法选型到模型部署的全链路工作,确保大模型技术在实际业务场景中的高效落地与应用; 5、将研究成果转化为实际生产力,推动大模型技术在公司产品中的应用,定期进行技术分享与交流,提升团队整体技术水平。

更新于 2025-06-03北京
logo of didi
社招技术

参与滴滴智能客服的对话算法工作,需要具备扎实的算法功底,结合业务场景,构建下一代客服 Agent,驱动服务体验与效率提升。 工作内容: 1、负责滴滴智能客服 Agent 底层的模型设计与训练工作,与产品、工程团队合作; 2、实施客服领域大模型的后训练工作,如大规模数据建设、Post-Training、偏好对齐等技术; 3、应用 Post-Training 方向前沿算法和框架,持续提升现有算法的效率与效果,解决领域模型的指令遵循、话术偏好、幻觉问题等; 4、关注行业前沿,推进有价值的技术与业务场景的结合,探索创新方法,推动技术创新。

更新于 2025-09-02北京
logo of dingtalk
社招3年以上技术类-算法

钉钉正在全面拥抱多模态AI,正在致力于将视觉大模型、边缘智能与实时视频分析深度融合,赋能智能零售、智慧工厂、智能交通等多个行业。我们拥有强大的工程化能力和创新研发氛围,期待志同道合的技术精英加入,共同推动视觉AI落地千行百业。 我们正在寻找在视觉AI领域具备真正工程化落地经验的技术人才,你将参与公司核心视觉AI系统的研发与优化,负责从算法设计、模型训练到高性能部署、大规模流式处理的全链路技术实现。具体职责包括: 1. 视觉大模型与算法开发 ○ 负责视觉大模型的后训练(Post-training)优化,包括微调、蒸馏、量化、剪枝等,提升模型在实际场景中的泛化能力与效率。 ○ 开发端侧视觉大模型,针对边缘设备进行轻量化设计与部署。 ○ 设计并实现传统CV算法(如目标检测、跟踪、姿态估计、图像增强等)与深度学习模型的融合方案。 ○ 构建视觉嵌入生成与特征提取模型,支持跨模态检索、相似性匹配等应用。 ○ 能根据实时性、性能、成本等多维约束,设计合理的算法组合与技术路线,实现最优落地效果。 ○ 在行业专家的指导下完成高质量的数据清洗和标注,建立多行业多场景的视觉AI评估框架 2. 高性能推理部署与优化 ○ 基于不同算法特性,选择并实施高并发、大吞吐的推理部署方案,熟练使用以下技术栈: ■ 推理框架:Triton Inference Server、ONNX Runtime、TensorRT ■ 部署平台:KServe + Triton / KServe + vLLM ○ 实现模型的动态批处理、自适应推理、低延迟响应,优化端到端服务性能。 ○ 负责模型格式转换、算子优化、硬件适配(GPU/TPU/NPU)及性能调优。 3. 分布式视频流处理系统构建是加分项 ○ 构建高可用、可扩展的分布式视频流处理 pipeline,支持多路视频流的实时接入与处理。 ○ 基于 Kafka + Flink 实现视频帧的流式消费、分发与状态管理。 ○ 完成视频数据的实时AI推理、结果聚合、元数据落盘,并与下游系统无缝集成。 ○ 保障系统在高负载下的稳定性、容错性与可监控性。 4. 跨团队协作与技术沉淀 ○ 与产品、业务、后端及硬件团队紧密协作,推动AI能力在真实业务场景中的落地。 ○ 输出技术文档、最佳实践,参与构建公司级AI工程化平台与工具链。

更新于 2026-02-10杭州
logo of didi
社招3年以上技术

负责搭建内容标签体系,构建知识图谱,优化知识表示方法 负责评价挖掘和情感识别 负责大模型的基础微调、后训练和模型压缩

更新于 2025-09-11北京