
地平线多模态大模型和语言大模型算法实习生
任职要求
1. 机器学习、计算机、数学、统计学相关专业硕士/博士; 2. 在经典机器学习、深度学习等一个或多个领域有扎实理论基础或丰富研发经验; 3. 有自动驾驶或者机器人相关研发经验优先,包括但不限于感知、预测、规划控制等; 4. 有LLM相关项目经验优先; 5. 深入了解数据结构、算法…
工作职责
1. 参与探索下一代端到端自动驾驶系统的研发; 2. 参与大模型关键技术建设,包括但不限于prompt工程、SFT、对齐及DPO等细分方向; 3. 负责端到端大模型自动驾驶系统的算法研发,包括但不限于多模态大模型、生成式世界模型、Diffusion model等方向; 3. 深入理解自动驾驶的应用场景,参与自动驾驶的数据集收集、整理、标注、管理等;
公司介绍 滴滴于 2016 年组建自动驾驶技术研发部门,致力于打造世界领先的 L4 级自动驾驶技术,通过科技让出行更安全、更高效。我们相信,将自动驾驶技术部署在共享出行车队中,将创造最大的社会价值。依托滴滴在出行领域的 先进技术、海量数据、丰富经验和完整的出行平台生态,我们正在打造并运营世界领先的自动驾驶 Robotaxi 车队,推动自动驾驶在城市复杂交通场景中的规模化落地。 职位描述 作为感知团队的一员,你将与国内外顶尖人才一起,研究和开发自动驾驶领域的前沿算法,直接赋能 L4 Robotaxi 的大规模部署。 你将面向真实城市道路场景中的多样化挑战,利用多模态传感器(LiDAR、Camera、Radar 等)设计、开发并优化感知算法,解决物体识别、障碍物检测、场景理解、意图预测与大模型赋能等核心问题。 在这里,你将有机会: 与中美两地的优秀工程师和科学家合作,参与世界级的技术竞争; 深入研究并推动最前沿的学术成果在产业中的落地; 在全球最大出行平台之一的业务场景中,实现科研成果的规模化应用。 主要方向与职责: 你将在以下方向中选定一个或多个方向深入负责,并承担从研发到落地、从算法到系统的端到端职责: (一)物体识别与跟踪 设计并实现基于 LiDAR / Camera / Radar 的多模态检测模型,识别车辆、行人、自行车、静态障碍物、交通标志等 提升精度、召回率与抗扰性(抗遮挡、夜间、恶劣天气、长尾类别) (二)通用障碍物识别 识别未知类别 /未训练类别的障碍物 基于异常检测 /开放类别识别的算法研究与工程实现 在非结构化环境(施工区域、道路损坏、落物等)中提升鲁棒性 (三)场景和意图理解 语义分割、实例分割、道路 /车道/交通标志/交通灯等结构物识别 场景理解,例如施工区域识别、可通行区域识别等 意图理解,例如行人动作识别、起步意图识别等 交互和事件识别,例如多方交互、交通规则冲突、非规范驾驶行为等 (四)感知大模型 /多模态 探索或应用预训练多模态大模型,将视觉、语言、地图/文本信息融合以增强感知能力 零样本 / 少样本 / 跨域泛化的策略研发 将大模型成果迁移到真实车队感知系统中,提升复杂场景下的鲁棒性 (五)模型评估、验证 构建完整的评估管道,包括离线评估 + 真实道路 + 模拟环境测试,支持回归检测与性能监控 指标体系设计 (Precision, Recall, IoU, latency, false positives rate 等)
搜索匹配算法&大模型算法 业务描述: 1、我们所在的组是为全球最大的B2B电商-alibaba.com搜索算法业务服务,致力打造全球顶级的搜索引擎,为全球200多国家的买家提供多语言搜索搜索匹配能力。 2、整个搜索全面转向大模型,升级文文匹配、多模态匹配的精准性,深化用户意图识别、打造英语、多言语言深度语义一流技术,并进行产品创新,实习智能问答,应用技术包括:RAG、强化学习、Agent、对话等等。 3、为搜索全链路(召回、粗排、相关性、精排、重排、增长&留存)效能不断提升进行优化。利用全球化、多文化的海量用户数据,对用户的诉求进行极致识别,促进业务目标的转化。 4、针对多国家、多语言用户带来的query长尾偏多,行为稀疏、不均衡问题,进行深度探索,更好理解用户的真实意图,让多样的货品与不同用户/群体,实现连接。
参与前沿大模型算法的研发与落地应用,方向包括但不限于:智能 Agent、Deep Research、多模态大模型、检索增强生成 (RAG) 等; 紧跟领域最新技术动态,探索创新算法方法,并积极推动科研成果的产出; 参与技术方案讨论、算法设计与实现、模型训练与优化等研发工作,保证项目进度和研发质量; 持续学习和掌握最新的大模型相关技术,并应用于实际产品和项目中,解决实际问题。
我们是网易云音乐算法团队,专注于行业领先的搜索或者推荐算法,我们致力于通过技术赋能云音乐各项业务,通过社区广场推荐,提升用户体验,产生商业化价值。 在这里你可以: 1、参与云音乐各场景相关的AIGC算法应用,使用NLP、多模态、LLM等技术,优化包括多模态内容理解、大模型交互式对话、大模型AI创作生成等业务应用的效果提升; 2、参与云音乐创新业务相关的算法优化,使用业界领先的深度学习、强化学习、图模型等,优化推荐、直播、声音、社交等业务的算法; 3、参与前沿的基础算法模型建设,包括继续预训练、视频生成微调,音乐生成训练等垂类基座模型的构建和应; 4、接触到亿级别海量、真实的用户数据,使用深度学习、强化学习、图模型等算法,发挥推荐的价值; 5、使用行业领先的大规模分布式机器学习平台,例如tensorflow等开源的工具,实现并不断优化推荐、搜索等算法。