
文远知行视觉大模型算法工程师(2026届校招)
任职要求
扎实的Python/C++开发能力,具备良好的编程习惯; 熟练掌握Python,熟悉Pytorch、transformers等常用工具,具备常用数据结构及算法的扎实基础; 熟悉视觉感知或大语言模型(LLM)技术,了解前沿视觉大语言模型技术。 工作地点:上海漕河泾开发区 加分项:具有自动驾驶感知算法研发经验;在顶级会议上发表过文章。
工作职责
关于我们人工智能模型的表现很大程度上依赖于高质量的训练数据。文远知行的数据团队拥有专业的数据标注团队和系统,我们的算法团队致力于通过先进的模型和算法通过自动和半自动标注提高标注效率和质量。 构建新一代大规模和高质量的视觉任务数据集; 研究视觉大模型关键技术,包括但不限于数据筛选、数据合成、模型训练、评测方法等。
1.参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用; 2.负责收集、整理和分析自动驾驶相关的数据集,进行数据预处理和标注,以提高模型的准确性和泛化能力; 3.设计和实现机器学习模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。
1.研发业界一流物理AI系统,包括不限于模仿学习, 强化学习, vla, vlm等训练系统与算法架构; 2.参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用; 3.设计和实现机器学习模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。
1、参与自动驾驶系统中多模态大模型算法的研究、开发与优化,包括但不限于世界模型、端到端感知大模型、VLA大模型、多模态视觉语言大模型、离线数据算法大模型等方面的应用; 2、负责设计实现不同领域应用的多模态大模型架构,对模型进行迭代优化,以车端模型/数据产线模型量产为主要目标; 3、设计和实现多模态大模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性; 4、针对多模态大模型模型进行车端/云端部署,能够让模型在大规模量产场景下高效运行,产生业务价值; 5、针对多模态大模型进行训练效率优化,实现训练提效。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 如果你,期望参与行业领先的3D商品建模方案,探索3D重建大模型算法,让手机拍摄稀疏图片高质量建模成为可能; 如果你,期望参与端侧实时3D真人数字人方案,探索人体重建、驱动和编辑算法,让构建数字人IP和用户数字分身轻松获取; 如果你,期望参与学术前沿的3D内容生成方案,探索基于3D模型的空间内容生成算法,让规模化生成制作3D内容触手可及; 如果你,期望参与基于苹果Vision Pro等新XR设备,发挥创意想法,探索下一个全民级的沉浸感体验应用; 如果你,期望将AI技术应用落地,转化为用户尖叫的产品体验,一起来吧; 那还犹豫什么,赶紧加入我们吧,你将与来自不同部门的优秀人才合作,不仅能够获得专业的培训和指导,还可以在工作中不断挑战自我,在职业生涯中不断成长和发展,享受工作中的乐趣和成就感。来吧,我们等你加入! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。