logo of hello

哈啰数据算法实习生(端到端数据挖掘方向)-【自动驾驶】

实习兼职算法地点:上海状态:招聘

任职要求


1. 本科及以上学历,计算机、电子信息、自动化、软件工程、车辆工程等相关专业优先;
2. Python基础扎实,熟练使用Python进行数据处理与算法开发;熟悉Linux操作系统、Shell命令与Git版本管理;
3. 了解ROS2/MCAP数据格式,对自动驾驶感知、决策、规划、控制有基本认知;
4. 掌握坐标…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 参与RoboTaxi 云端数据挖掘系统研发,深度参与L4级自动驾驶数据闭环核心链路,处理亿级路测数据,为端到端自动驾驶模型训练提供高质量场景标签与数据保障;
2. 负责驾驶场景挖掘算子开发与迭代优化:
    - 基于ROS2、MCAP数据格式,开发急刹、加塞、变道、路口转弯、横纵向博弈等驾驶行为检测算子;
    - 实现路口、环岛、分合流、盲区等典型场景分类;
    - 完成感知质量评估、障碍物风险识别、交互行为判定等难例挖掘能力建设,持续提升算子准确率与召回率;
3. 负责自动驾驶数据管线开发与维护:完成数据解析、坐标系转换(WGS84/UTM)、地理空间查询、Map数据适配等数据预处理工作,保障数据链路稳定高效;
4. 参与Ray分布式批处理框架下的数据挖掘任务开发、调试与性能优化,支撑大规模数据并行处理;
5. 开展挖掘结果误报/漏报分析,定位算法缺陷,推动算子迭代与数据闭环持续优化;
6. 协助完成数据标注方案设计、标签质量校验、评测用例沉淀等数据闭环相关工作。
包括英文材料
学历+
Python+
算法+
Linux+
还有更多 •••
相关职位

logo of bytedance
实习A213191

团队介绍:短视频平台算法团队,负责国际化短视频产品的基础推荐算法,加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,直接为核心用户体验负责,支持产品在全球赛道上高速发展。我们的工作内容包括大规模推荐算法的优化、复杂约束的优化问题的解决、多模态大模型的落地探索,推荐大模型的应用研究等多个学术领域的算法改进以及对多种场景的推荐架构的设计和对产品数据的复杂深入的分析。在这里,你可以深入钻研机器学习算法的改进和优化,探索前沿的技术;可以跟来自全球不同国家的团队合作, 感受不同文化的碰撞, 激发认知;可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 课题介绍: TikTok作为全球领先的短视频平台,面临新用户数据稀疏导致的个性化推荐不足、直播推荐时效性要求高、用户兴趣多样性维护困难以及电商推荐系统链路复杂等多重挑战。传统推荐方法依赖历史行为建模,难以解决新用户冷启动问题,且直播推荐需在极短窗口期内(通常30分钟内)实时捕捉内容动态变化(如主播互动、流量波动),这对系统的实时感知与快速决策能力提出更高要求。此外,单列沉浸式场景放大了多样性问题,需平衡多峰兴趣学习与探索引发的内容穿越风险。当前电商推荐系统采用多阶段漏斗架构(召回-排序-混排),存在链路不一致、维护成本高、过度依赖短期价值预测等问题,导致用户易陷入内容同质化疲劳。 针对上述痛点,项目提出结合大语言模型(LLM)和大模型技术实现突破:一方面利用LLM的海量知识储备与Few-shot推理能力,通过注册信息与外部知识推理新用户潜在意图,缓解冷启动问题;另一方面,在社交偏好建模中融合GNN与用户全生命周期行为序列,提升兴趣预测精准度。同时,探索大模型的泛化能力、长上下文感知及端到端建模优势,简化电商推荐链路,增强实时动态适应性与兴趣探索能力,最终实现系统更简洁、推荐更精准、用户体验与留存双提升的目标,推动业务可持续增长。 1、负责TikTok业务推荐算法工作,与来自国内外顶级名校、有丰富业界经验的同学合作,共同搭建行业顶尖的推荐系统,为用户提供一流的产品体验; 2、将最前沿的机器学习技术应用到TikTok业务,包括混排/排序/多目标/召回/冷启动/探索/多样性/内容理解等等场景,不断优化用户体验,促进业务发展; 3、研究方向包含且不局限于:深度学习、图神经网络、多任务学习、排序学习、模型压缩和加速、多模态技术等,结合业务的实际问题来做好技术的探索和研究; 4、和产品、运营团队紧密合作,通过对产品和用户的深入理解和分析,制定算法策略促进短视频生态的长期繁荣发展。

更新于 2025-03-04北京
logo of bytedance
实习A232250

团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 为什么加入我们 与团队共同激发创造:创造是 TikTok的核心。不管对于TikTok产品还是团队本身,我们都希望能激发更多想象力,为自己、平台、我们所服务的社区以及社会带来更多价值和影响。 在有挑战的事中成长:在TikTok,你能够参与非常有挑战性的项目,一起做出突破行业、有全球影响力的事。这里有数以亿计的用户,在等你用新技术、新想法为他们带来新的体验。我们从不安于现状,对我们来说,每一个挑战,无论多么困难,都是一个学习、创新、和成长的机会。 工作方式和文化:我们鼓励务实解决实际问题、在每件事上追求极致,希望大家始终像“创业第一天”那样做事。
公司文化多元兼容,同事之间像同学一样平等相处,机制敏捷灵活,希望更好地激发每个人的创造力。 优秀的人能获得认可与回报:优秀人才能够和公司共同成长,什么时候加入都不晚。我们也进一步加大了激励区分度,让优秀的人得到认可和回报、承担更多重要项目,充分发挥潜能,脱颖而出。 欢迎加入我们! 课题介绍: TikTok作为全球领先的短视频平台,面临新用户数据稀疏导致的个性化推荐不足、直播推荐时效性要求高、用户兴趣多样性维护困难以及电商推荐系统链路复杂等多重挑战。传统推荐方法依赖历史行为建模,难以解决新用户冷启动问题,且直播推荐需在极短窗口期内(通常30分钟内)实时捕捉内容动态变化(如主播互动、流量波动),这对系统的实时感知与快速决策能力提出更高要求。此外,单列沉浸式场景放大了多样性问题,需平衡多峰兴趣学习与探索引发的内容穿越风险。当前电商推荐系统采用多阶段漏斗架构(召回-排序-混排),存在链路不一致、维护成本高、过度依赖短期价值预测等问题,导致用户易陷入内容同质化疲劳。 针对上述痛点,项目提出结合大语言模型(LLM)和大模型技术实现突破:一方面利用LLM的海量知识储备与Few-shot推理能力,通过注册信息与外部知识推理新用户潜在意图,缓解冷启动问题;另一方面,在社交偏好建模中融合GNN与用户全生命周期行为序列,提升兴趣预测精准度。同时,探索大模型的泛化能力、长上下文感知及端到端建模优势,简化电商推荐链路,增强实时动态适应性与兴趣探索能力,最终实现系统更简洁、推荐更精准、用户体验与留存双提升的目标,推动业务可持续增长。 1、负责TikTok最核心的业务推荐算法工作,与来自国内外顶级名校、有丰富业界经验的同学合作,共同搭建行业顶尖的推荐系统,为用户提供一流的产品体验; 2、将最前沿的机器学习技术应用到国际化短视频的核心场景业务,包括混排/排序/多目标/召回/冷启动/探索/多样性/内容理解等等场景,不断优化用户体验,促进业务发展; 3、研究方向包含且不局限于:深度学习、图神经网络、多任务学习、排序学习、模型压缩和加速、多模态技术等,结合业务的实际问题来做好技术的探索和研究; 4、和产品、运营团队紧密合作,通过对产品和用户的深入理解和分析,制定算法策略促进短视频生态的长期繁荣发展。

更新于 2025-03-04上海
logo of bytedance
实习A227192A

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:短视频平台算法团队,负责国际化短视频产品的基础推荐算法,加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,直接为核心用户体验负责,支持产品在全球赛道上高速发展。我们的工作内容包括大规模推荐算法的优化、复杂约束的优化问题的解决、多模态大模型的落地探索,推荐大模型的应用研究等多个学术领域的算法改进以及对多种场景的推荐架构的设计和对产品数据的复杂深入的分析。在这里,你可以深入钻研机器学习算法的改进和优化,探索前沿的技术;可以跟来自全球不同国家的团队合作, 感受不同文化的碰撞, 激发认知;可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、负责国际化短视频算法工作,共同搭建业界领先的推荐系统,为用户提供一流的产品体验; 2、理解机器学习技术与业务目标,端到端独立负责推荐系统,确保用户在TikTok平台上能够更好地发现和消费音乐;构建行业领先的推荐系统,为用户的创作过程提供精确的音乐推荐与高品质的音乐体验,提升用户的创作体验; 3、应用先进的机器学习技术解决各种在线/离线,大数据量/小数据量,长期/短期信号等不同场景遇到的各种挑战,包括标签缺失,反馈周期长,收敛速度慢,信号相关性弱等; 4、和产品以及运营团队紧密合作,对用户、作者的行为做深入的理解和分析,制定针对的算法策略促进生态良性发展。

更新于 2026-01-05北京
logo of bytedance
实习A21875

团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 课题介绍:TikTok作为全球领先的短视频平台,面临新用户数据稀疏导致的个性化推荐不足、直播推荐时效性要求高、用户兴趣多样性维护困难以及电商推荐系统链路复杂等多重挑战。传统推荐方法依赖历史行为建模,难以解决新用户冷启动问题,且直播推荐需在极短窗口期内(通常30分钟内)实时捕捉内容动态变化(如主播互动、流量波动),这对系统的实时感知与快速决策能力提出更高要求。此外,单列沉浸式场景放大了多样性问题,需平衡多峰兴趣学习与探索引发的内容穿越风险。当前电商推荐系统采用多阶段漏斗架构(召回-排序-混排),存在链路不一致、维护成本高、过度依赖短期价值预测等问题,导致用户易陷入内容同质化疲劳。 针对上述痛点,项目提出结合大语言模型(LLM)和大模型技术实现突破:一方面利用LLM的海量知识储备与Few-shot推理能力,通过注册信息与外部知识推理新用户潜在意图,缓解冷启动问题;另一方面,在社交偏好建模中融合GNN与用户全生命周期行为序列,提升兴趣预测精准度。同时,探索大模型的泛化能力、长上下文感知及端到端建模优势,简化电商推荐链路,增强实时动态适应性与兴趣探索能力,最终实现系统更简洁、推荐更精准、用户体验与留存双提升的目标,推动业务可持续增长。 1、负责TikTok的推荐算法工作,包括但不限于:视频推荐、内容理解、因果推断、智能增长等,为用户提供领先的产品体验; 2、结合机器学习技术和业务场景需求,运用包括强化学习、Graph Embedding、大模型、大规模计算等在内的前沿建模技能,解决业务痛点,提升线上效果; 3、与产品及运营团队紧密合作,对用户的行为进行深入理解和分析,制定合理高效的策略逻辑,促进生态的健康发展; 4、参与算法团队的基建工作,提升资源利用率、增强效果稳定性、优化开发流程等,持续提高团队成员的工作效率。

更新于 2025-03-03北京