logo of sensetime

商汤多模态算法研究员

社招全职算法研究地点:上海 | 深圳状态:招聘

任职要求


1. 计算机、电子信息、数学等相关专业硕士及以上学历;
2. 熟练使用PythonC/C++,掌握PyTorchTensorflow深度学习框架之一;
3. 熟悉目标检测、跟踪、分割、分类等传统视觉算法,具有跨模态算法的研究经验,对多模态算法的研究和落地具有强烈的热情;
4. 在CVPR/ICCV/ECCV/NeurPS/ICLR/ACL/EMNLP等学术顶会有相关论文发表,或在相关国际竞赛中取得优异成绩者优先;
5. 参与过有影响力的多模态算法项目者优先;
6. 具有优秀的分析问题和解决问题的能力,具有良好的沟通能力和团队合作能力,在工作中敢于突破与创新,对解决具有挑战性的问题充满激情;

工作职责


1. 面向智慧城市大规模图像/视频内容分析场景,参与VLM、MLLM等多模态算法的研究工作,探索城市视觉智能更好的解决方案,帮助下游产品线在行业内建立技术优势;
2. 构建和维护相关研究方向的代码框架、数据基础,紧跟学术前沿,输出创新研究成果;
包括英文材料
学历+
Python+
C+
C+++
PyTorch+
TensorFlow+
深度学习+
算法+
CVPR+
ICCV+
ECCV+
相关职位

logo of jd
社招算法开发岗

1. 负责多模态算法的开发与优化,包括但不限于多模态理解、基座模型、多模态理解(InternVL、Qwen-VL、Seed-VL)等领域,推动多模态理解与生成技术的融合与创新; 2. 深入研究多模态算法的前沿技术,结合业务需求,设计并实现高效、准确的算法模型,解决实际业务中的复杂问题; 3. 参与多模态算法相关项目的规划与实施,确保项目按时高质量完成,达到预期的业务目标; 4. 与团队成员及其他部门紧密合作,共同推进多模态算法在实际业务场景中的应用,提升整体业务的智能化水平; 5. 持续关注行业动态,引入先进的技术理念和方法,优化现有算法框架,提升团队的技术竞争力。

更新于 2025-06-15
logo of bytedance
社招A103072A

团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、探索大规模和多模态LLM,并将系统优化到其它先进模型(如Gemini, GPT)的水平; 2、多模态预训练、指令微调、人类偏好对齐和模型压缩; 3、落地相关应用,包括视频理解、推荐和代码生成等; 4、深入研究并与全球一流大学的研究人员进行学术合作。

更新于 2024-03-25
logo of bytedance
校招A07264

团队介绍:国际商业化产品与技术团队支持字节跳动国际产品的广告产品与变现技术。我们负责end2end的大型广告系统建设,为客户提供商业推广方式与方案。我们的团队遍布北京、上海、美国、新加坡等地,在这里你将有机会开阔自己的国际化视野,接触到全球领先的商业产品架构、模型和算法,并有机会参与并推动互联网广告行业的创新和变革。 课题背景: 随着LLM大模型和多模态技术的快速发展,给下一代广告系统带来了重大机会,LLM可以根据广告平台的投放经验和数据,并且结合对广告大模型的理解,通过Reflection、RLHF等技术构建与真实环境交互的Agent,从而实现专家级别的广告账号管理,实现最高的ROI。同时广告Agent可探索根据用户的兴趣,个性化实现在线素材生产,最终实现广告素材和创意样式的千人千面,极大撬动用户和商品的匹配效率。 课题挑战: 现有的LLM在垂直广告营销领域上尚不能给出专业且能提升效果的专业知识,并且Agent无法很好的操作和里面广告系统。在创意方面,视频生成模型质量还不能满足广告生成的要求,以及和投放系统结合千人千面的个性化效果。 1、负责广告、电商、短视频、直播等相关内容理解,包括图片、文本、视频、音频等; 2、负责数据挖掘与特征工程,构建机器学习模型,构建商业化生态; 3、面对千万量级业务/受限资源等场景,优化模型计算效率,提升模型可用性; 4、依托海量业务数据,探索并落地各种前沿技术(如预训练、自监督学习、小样本学习等); 5、探索AIGC前沿技术,构建新一代基于AIGC的商业化生态。

更新于 2025-05-26
logo of bytedance
校招A151989

团队介绍:国际商业化产品与技术团队支持字节跳动国际产品的广告产品与变现技术。我们负责end2end的大型广告系统建设,为客户提供商业推广方式与方案。我们的团队遍布北京、上海、美国、新加坡等地,在这里你将有机会开阔自己的国际化视野,接触到全球领先的商业产品架构、模型和算法,并有机会参与并推动互联网广告行业的创新和变革。 课题背景: 随着LLM大模型和多模态技术的快速发展,给下一代广告系统带来了重大机会,LLM可以根据广告平台的投放经验和数据,并且结合对广告大模型的理解,通过Reflection、RLHF等技术构建与真实环境交互的Agent,从而实现专家级别的广告账号管理,实现最高的ROI。同时广告Agent可探索根据用户的兴趣,个性化实现在线素材生产,最终实现广告素材和创意样式的千人千面,极大撬动用户和商品的匹配效率。 课题挑战: 现有的LLM在垂直广告营销领域上尚不能给出专业且能提升效果的专业知识,并且Agent无法很好的操作和里面广告系统。在创意方面,视频生成模型质量还不能满足广告生成的要求,以及和投放系统结合千人千面的个性化效果。 1、负责广告、电商、短视频、直播等相关内容理解,包括图片、文本、视频、音频等; 2、负责数据挖掘与特征工程,构建机器学习模型,构建商业化生态; 3、面对千万量级业务/受限资源等场景,优化模型计算效率,提升模型可用性; 4、依托海量业务数据,探索并落地各种前沿技术(如预训练、自监督学习、小样本学习等); 5、探索AIGC前沿技术,构建新一代基于AIGC的商业化生态。

更新于 2025-05-26