字节跳动端侧大模型算法研究实习生-移动OS-筋斗云人才计划
实习兼职A37385A地点:北京状态:招聘
任职要求
1、2026届及之后毕业,博士在读,计算机、人工智能、计算机视觉、数据科学相关专业优先; 2、扎实的机器学习、NLP/CV/序列建模等基础,具备多模态数据处理等研究背景; 3、熟悉Transformer、Diffusion、GAN、CNN/RNN等模型基础结…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
团队介绍:专注于探索AI和智能硬件的结合,为用户提供更自然和便捷的交互体验的研发团队,隶属于产品研发与工程架构部。作为负责AI技术应用场景探索的部门,是字节在智能硬件领域提供综合方案研究的核心部门。我们欢迎期待心怀技术理想、不断挑战技术难题的“你”的加入,和顶尖团队一起参与技术攻坚,开启更多可能。 课题背景 随着移动设备的普及和计算能力的提升,端侧AI逐渐成为智能设备的核心驱动力。端侧设备要求不仅要具备高效的计算能力,还需要在保证推理质量的前提下,优化性能和资源使用。尤其是在复杂任务推理、图像生成、意图分类和个性化记忆建模方面,如何设计高效、灵活的系统和模型,已成为当前的研究重点。本课题聚焦于端侧设备上的智能任务推理与生成模型优化,涉及扩散模型(如Stable Diffusion)的精简与高效训练、复杂任务的多意图推理与编排,以及个性化记忆模型的构建与优化,推动端侧AI在各类应用场景中的广泛落地。 课题挑战 1、多意图与任务处理: - 精准理解用户输入中的多意图,推导意图间关系,设计鲁棒的任务推理方法。 - 设计高效的任务编排系统,支持多任务并行执行,并能根据复杂场景需求动态调整任务执行顺序。 - 针对复杂任务链条,构建动态规划与优化机制,实现高效任务分配与执行,确保多场景切换时规划合理稳定。 2、个性化记忆建模与搜索: - 应对行为数据稀疏性,基于长期行为设计有效特征提取与建模方法,构建个性化的记忆模型,提升用户交互的精准度与体验。 - 提升记忆模型鲁棒性和泛化能力,设计轻量化模型兼顾端侧与云端部署。 - 在端侧设备实现低延迟全局搜索,优化计算资源提升搜索效率。 3、扩散模型优化与部署: - 如何在保持生成质量的前提下,精简Stable Diffusion等扩散模型以适应端侧设备。 - 设计轻量化的网络架构和高效的采样策略,提升模型的运行速度与效率。 - 针对不同应用场景优化模型生成能力,提升对复杂背景、动态内容的适应性。 4、 GUI自动化操作: - 实现通用化GUI自动化操作,支持多种设备界面。 - 优化自动化操作的效率与准确性,减少用户干预需求。 通过整合这些方向,课题将实现端侧设备的智能任务推理和生成能力提升,推动智能助手、图像生成等应用场景的技术进步。
包括英文材料
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
数据科学+
https://roadmap.sh/ai-data-scientist
Step by step roadmap guide to becoming an AI and Data Scientist
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
NeurIPS+
https://neurips.cc/
ICML+
https://icml.cc/
ICLR+
https://iclr.cc/
CVPR+
https://cvpr.thecvf.com/
ICCV+
https://iccv.thecvf.com/
ICCV is the premier international computer vision event comprising the main conference and several co-located workshops and tutorials.
还有更多 •••
相关职位
实习
1. 参与机器人导航系统中大模型和感知模型的算法研究、开发与优化,包括但不限于VLA模型、VLN模型等。 2. 参与自动驾驶系统中大模型和感知模型的算法研究、开发与优化,包括但不限于VLA模型、VLM模型、Occupancy模型等。 3. 参与AI Infra的研发,包括但不限于大模型训练加速、云侧推理加速、端侧推理加速。 4. 将实习成果提炼总结,撰写学术论文,投稿AI顶会顶刊。
更新于 2025-11-13广州

实习算法研究
1. 面向车舱场景,参与端侧VLM、MLLM等多模态算法的研究工作,探索车舱多模态大模型/智能车舱更好的解决方案,帮助产品线在行业内建立技术和数据优势; 2. 构建和维护相关研究方向的代码框架、数据基础,紧跟学术前沿,输出创新研究成果;
更新于 2026-01-08北京|深圳

校招算法研究
1. 面向车舱场景,参与端侧VLM、MLLM等多模态算法的研究工作,探索车舱多模态大模型/智能车舱更好的解决方案,帮助产品线在行业内建立技术和数据优势; 2. 构建和维护相关研究方向的代码框架、数据基础,紧跟学术前沿,输出创新研究成果;
更新于 2026-01-15北京|上海|深圳