
商汤数据挖掘算法工程师
社招全职2年以上算法工程地点:北京状态:招聘
任职要求
1.硕士及以上学历,计算机科学、自动化、人工智能、机器人等相关专业,2年以上算法研发经验; 2.扎实的编程能力(Python/C++),精通PyTorch框架; 3. 具备自动驾驶数据(图像/视频/文本/点云)的处理经验,熟悉自动驾驶数据集(如Waymo、nuScenes)以及自动驾驶业务; 4.具备扎实的深度学习基础,熟悉CLIP、BLIP2等VLM模型原理及调优方法; 5.具备强烈的业务驱动思维,能解决实际问题。 加分项: - 在CVPR/ICCV/ECCV等顶会发表过VLM相关论文; - 具备视频类多模态大模型的项目经验; - 具备感知算法、仿真数据生成等自动驾驶领域项目经验
工作职责
1、研发基于VLM/多模态大模型的数据挖掘算法,精准识别自动驾驶长尾场景(如极端天气、复杂交通参与行为、罕见障碍物等)。 2、构建高效的自动化数据挖掘Pipeline,提升数据标签质量并降低标注成本。 3、 结合点云、图像、文本等多模态数据,设计多模态特征,支持数据的跨模态检索
包括英文材料
学历+
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
自动驾驶+
https://www.youtube.com/watch?v=_q4WUxgwDeg&list=PL05umP7R6ij321zzKXK6XCQXAaaYjQbzr
Lecture: Self-Driving Cars (Prof. Andreas Geiger, University of Tübingen)
https://www.youtube.com/watch?v=NkI9ia2cLhc&list=PLB0Tybl0UNfYoJE7ZwsBQoDIG4YN9ptyY
You will learn to make a self-driving car simulation by implementing every component one by one. I will teach you how to implement the car driving mechanics, how to define the environment, how to simulate some sensors, how to detect collisions and how to make the car control itself using a neural network.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
CVPR+
https://cvpr.thecvf.com/
ICCV+
https://iccv.thecvf.com/
ICCV is the premier international computer vision event comprising the main conference and several co-located workshops and tutorials.
ECCV+
https://eccv.ecva.net/
ECCV is the official event under the European Computer Vision Association and is biannual on even numbered years.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
相关职位
社招2年以上G341
1、研究数据挖掘或统计学习领域的前沿技术,针对海量用户行为和内容信息,构建和优化用户画像以及用户属性; 2、基于对用户理解和大量数据特征,参与风控、精准营销、个性化定价等模型建设和领域研究,提升产品效果; 3、根据公司需要寻找和采集相关数据,对原始数据进行清理、甄别、归类和整合,并实现流程自动化。
更新于 2020-11-11

社招2年以上
1. 负责国际机票智能运营系统的搭建,利用数据科学相关手段解决报价策略、收益管理等供应链核心问题; 2. 负责国际机票供应链核心业务的策略优化,数据驱动改进业务流程,提升总体效率和核心指标; 3. 负责国际机票供应链相关数据的定量分析,洞察数据背后的业务规律和价值,发掘优化方向,探索解决方案.
更新于 2023-03-27
校招J1002
1、负责海量短视频生产链路算法优化,基于视频特效、用户画像、行为序列、消费反馈等大规模数据信号进行算法建模,加强特效、美颜等视频生产业务的智能化; 2、通过异常检测、因果推断、自动归因等算法等对生产、消费数据进行挖掘,洞察业务痛点,指导业务优化方向; 3、挖掘热点事件、预测流行趋势,帮助视频特效等业务更好运营和生产; 4、挖掘用户特征,用于提升广告与用户匹配的效率、业务反欺诈、渠道反作弊、搜索索引等业务场景。
更新于 2025-07-30