
文远知行大模型研发工程师(2026届校招)
任职要求
计算机科学、人工智能、机器学习等相关专业硕士及以上学历。 熟练掌握 Python、C++等编程语言,具备扎实的代码实现能力。 深入理解深度学习理论,熟练使用至少一种深度学习框架,如 PyTorch、TensorFlow 等。 在LLM、VLM、VLA等相关领域有扎实的研究基础和实践经验,熟悉常用的大模型架构和训练方法。 具备较强的数学基础,能够运用数学工具解决实际问题。 有良…
工作职责
一、工作地点 上海 二、 负责自动驾驶领城LLM、VLM、VLA相关算法的设计与优化,探索其在自动驾驶各环节的创新应用,以提升自动驾驶系统的整体性能和安全性。 基于海量自动驾驶数据,进行模型训练和调优,挖掘数据价值,构建高质量数据集,提高模型的泛化能力和准确性。 开发基于大模型的数据分析工具和平台,为自动驾驶研发提供数据驱动的决策支持,推动自动驾驶技术的持续进步。 推动大模型算法在实际自动驾驶产品中的部署与落地性,满足自动驾驶在各种场景下的应用需求。 三、

关于我们人工智能模型的表现很大程度上依赖于高质量的训练数据。文远知行的数据团队拥有专业的数据标注团队和系统,我们的算法团队致力于通过先进的模型和算法通过自动和半自动标注提高标注效率和质量。 构建新一代大规模和高质量的视觉任务数据集; 研究视觉大模型关键技术,包括但不限于数据筛选、数据合成、模型训练、评测方法等。

1.负责途虎自动化运维平台的设计和开发; 2.参与途虎容器化、同城多活等项目的建设及推广落地; 3.完善运维管理自动化工作流程和方法,不断迭代实现运维交付工具的集成,提高运维效率; 4.结合大模型(DS、Qwen、GPT等)技术,参与运维知识库构建、智能问答和自动化决策系统的研发。

base地 北京/上海/广州/深圳 1.进行数据闭环,分布式模型训练框架和管理系统的软件研发; 2.基于云原生和 Kubernetes 生态系统,打造高可用和高稳定性的复杂业务系统; 3.负责训练框架前沿技术的探索和研究,负责分布式训练架构体系的演进; 4.打造自动驾驶领域的数据闭环系统,自动驾驶大规模离线仿真技术等高水平大模型基础软件。

1.模型研发:参与LLM预训练、SFT指令微调、RLHF/GRPO人类反馈强化学习,提升模型指令遵循与推理能力; 2.效率优化:负责模型量化(INT8/INT4)、蒸馏、投机解码、KV Cache优化,降低推理成本与延迟; 3.系统架构:基于vLLM/SGLang/TensorRT构建高吞吐推理服务,支持多实例水平扩展与动态调度; 4.应用落地:开发RAG检索增强系统、Agent智能体,结合知识图谱/向量数据库解决业务实际问题; 5.数据工程:构建高质量指令数据集,设计数据采样、去重、质量筛选策略,搭建数据-训练-评测闭环; 6.评测迭代:建立模型能力评测体系,分析Bad Case,持续优化模型在垂直领域的表现。