
文远知行感知infra工程师(26届校招)-环卫车事业部-广州/深圳
任职要求
有丰富的C++ 和 python 开发经验,精通常用的数据结构和算法。 具备一定的编译环境构建能力,有CUDA相关经验。 对操作系统,计算机网络,计算机体系结构,并行计算等计算机基础知识有深入理解。 具有良好的…
工作职责
工作内容: 快速熟悉现有感知系统架构,梳理感知各模块作用和系统资源占用情况,持续跟踪评估新上feature,针对特定应用场景评估决策是否引入,并能实施代码重构。 建立灵活的监控与评估框架,全面分析评估感知系统中各个算法的性能与端到端的影响。 能优化或重构具体算法,降低资源使用率。 分析感知相关的系统问题。

【26届校招】自动驾驶系统研发工程师(Infra/C++)-环卫车事业部-广州/深圳/武汉 欢迎C++ Top Coder,加入全国技术领先的自动驾驶研发团队; 你会主要负责感知系统/规划与控制/平台基础系统的架构建设以及优化; 感知组——P8N Infra方向:广州,深圳 规划与控制组——PnC Infra方向:广州,深圳,武汉 基础系统——基础自动驾驶系统Infra方向:深圳
通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 若你对以下一个或者多个方向感兴趣均欢迎投递: 1)多模态基础模型的研发,包括融合视觉语言的跨模态理解模型设计,提升视觉基础模型在图像/视频中的视觉知识、空间感知、Omni Parsing 等核心能力,并同时优化多模态大模型的AI infra。 2)通过强化学习(RL)持续提升多模态模型推理能力和执行任务能力,构建支持网络世界(PC/Mobile/Web/游戏)交互的通用智能体,将相关能力拓展到GUI agent,VLA,以及具身智能场景中。 3)研究理解与生成统一的模型架构,实现跨模态生成与推理的协同优化。 工作职责: 1. 多模态 pre-training:开展研究及进行实验,研究内容包括:数据清洗筛选、数据配比优化、课程学习、视觉语言模型结构设计与优化、训练策略优化、预训练数据合成、scaling law 预测、词表优化、模型蒸馏与压缩、长上下文能力优化等。 2. 多模态 post-training:迭代 post-training 训练策略(SFT/RLHF),专项能力数据迭代,参与模型能力评测及评测数据和评估标准的迭代。 3. 多模态推理和通用 agent:通过强化学习(RL)持续提升多模态模型推理能力和执行任务能力,打造多模态的 test scaling laws,并推动模型对网络和虚拟世界的交互和任务完成能力。 4. 统一理解生成:构建视觉统一理解生成大模型,推进多模态统一生成与理解的推理和交互新范式。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式。主要工作方向包括: 1、研究AI大模型的关键能力,通过技术愿景来驱动研究工作,包括大模型的学习、记忆、推理、规划、感知等长期话题; 2、尽情探索探索超大规模模型,致力于实现极致的系统优化; 3、深入参与数据建设、大规模预训练、指令微调、偏好对齐、模型优化等关键工作; 4、大力推动大模型应用落地,为社会创造福祉。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式。主要工作方向包括: 1、研究AI大模型的关键能力,通过技术愿景来驱动研究工作,包括大模型的学习、记忆、推理、规划、感知等长期话题; 2、尽情探索探索超大规模模型,致力于实现极致的系统优化; 3、深入参与数据建设、大规模预训练、指令微调、偏好对齐、模型优化等关键工作; 4、大力推动大模型应用落地,为社会创造福祉。