logo of bytedance

字节跳动科学大模型研究实习生-ByteDance Research-筋斗云人才计划

实习兼职A40172A地点:上海状态:招聘

任职要求


1、2026届及以后毕业,博士在读,计算机科学、电气计算机工程等相关专业优先;
2、在AI和机器学习方面拥有很强的研究经验,在国际顶会(例如ICMLNeurIPSICLR)和期刊上发表过论文,涵盖大语言模型,扩散模型,几何深度学习自然语言处理,蛋白质设计,蛋白质结构和构象预测等领域;
3、精通PythonPytorch

工作职责


团队介绍:字节跳动ByteDance Research专注于人工智能领域的前沿技术研究,涵盖了机器翻译、视频理解基础模型、机器人研究、机器学习公平性、量子化学、AI 制药、分子动力学等多技术研究领域,同时致力于将研究成果落地,为公司现有的产品和业务提供核心技术支持和服务。

课题介绍:
我们利用Al技术进行药物的自动发现和设计,大幅降低药物开发的成本,推动药物开发的范式转移。主要利用深度学习进行大分子药物的设计。

领域优势:团队在生成式蛋白质设计、蛋白质构象预测以及冷冻电镜解析等领域取得了业界瞩目的成果。
在生成式蛋白质设计方面,团队研发了基于大规模蛋白质语言模型的序列设计方法LM-Design,大幅提高了蛋白质序列设计的准确度与效率;研发了结合扩散模型与语言模型的新一代蛋白质基础模型DPLM和DPLM-2,首次全面统一了蛋白质序列和结构的联合建模、理解与生成;研发了基于偏好优化的抗体设计方法AbDPO,能够设计出同时满足多种性质和能量要求的抗体。在蛋白质动态构象预测方面,团队研发了ConfDiff等模型,准确预测了蛋白质的构象变化,加深了对蛋白质生物过程的理解,还为新药研发提供了可靠的理论基础。冷冻电镜解析方面,团队研发了CryoSTAR电镜解析工具和CryoFM冷冻电镜基础模型,结合人工智能技术和高分辨率成像,极大地提升了生物大分子结构解析的速度和精度。这一技术有助于揭示复杂生物分子体系的构象特征和动态变化,为药物靶点的发现与设计提供了强有力的支持。

团队的研究成果多次发表在ICML、NeurIPS、ICLR等顶级学术会议上,得到学术界和业界的广泛认可。

1、开发自然科学的基础大模型,用于蛋白质结构预测、分子构象生成和蛋白质设计;
2、利用公共基准和数据库评估新的AI/ML方法;
3、与多学科团队密切合作,将创新算法应用于解决前沿挑战。
包括英文材料
机器学习+
ICML+
NeurIPS+
深度学习+
NLP+
Python+
PyTorch+
相关职位

logo of bytedance
实习A61184

团队介绍:字节跳动ByteDance Research专注于人工智能领域的前沿技术研究,涵盖了机器翻译、视频理解基础模型、机器人研究、机器学习公平性、量子化学、AI 制药、分子动力学等多技术研究领域,同时致力于将研究成果落地,为公司现有的产品和业务提供核心技术支持和服务。 课题介绍:我们的使命是研究攻克下一代智能机器人最挑战的技术,一方面重点聚焦在机器人基础模型、智能感知-操作-交互方面,研发业界最领先的技术,孵化下一代智能机器人系统,同时,我们也聚焦于实现在实际场景中真正可用的机器人产品,通过实际业务驱动,在复杂的机器人与人共存的环境中,打造软硬件与算法领先的高智能机器人。 领域优势: 1、由世界顶尖的机器人科学家和工程师组成,面向下一代机器人研究最前沿、最关键的基础问题,并进行规模化应用拓展。 2、团队在数据、算力和软硬件上具备优势,在机器人基础模型、智能感知-操作-交互上研发一系列世界级引领性技术,打造通用机器人和学习系统。 3、团队在感知、定位、重建、规划等全链条的机器人核心算法方面积累优势,并在实际场景和数据中进行最新算法的探索研究。 我们期待对机器人研究有热情并有相关经验的优秀博士生加入。 1、从事大规模机器人基础模型的预训练、微调和优化研究,以模型为中心,提升机器人的智能边界; 2、探索多模态大模型前沿问题,推动在机器人上的大规模扩展,包括但不限于抓取操作、运动控制、世界建模等; 3、参与孵化下一代智能机器人技术和新产品。

更新于 2025-03-04
logo of bytedance
实习A213993

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:ByteDance Research专注于人工智能领域的前沿技术研究,涵盖了机器翻译、视频理解基础模型、机器人研究、机器学习公平性、量子化学、AI 制药、分子动力学等多技术研究领域,同时致力于将研究成果落地,为公司现有的产品和业务提供核心技术支持和服务。 1、构建多语言大语言模型,端到端的语音翻译系统、多语言机器翻译、文本生成和其他核心自然语言处理算法; 2、为不同应用场景构建基本的自然语言处理组件; 3、在我们的产品上进行前沿的自然语言处理算法研究和应用。

更新于 2024-07-29
logo of bytedance
实习A183941

Top Seed人才计划-豆包大模型研究实习生专项:面向 2025 年 9 月及以后毕业的博士及本硕在读同学,加入我们,你可以自主决定研究课题,与正式员工享受同等权限和资源,和优秀的研究员一起,向智能上限发起挑战。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、AI搜索总结Agent研发: 1)设计并实现基于LLM的搜索总结Agent,提升搜索结果的理解、推理与结构化总结能力; 2)探索LLM Reasoning技术(如思维链、多步推理),优化复杂查询的Deep Research模式,实现长文本理解与跨文档信息融合; 3)构建端到端系统,涵盖意图识别、知识检索、结果生成与偏好对齐,提升用户体验; 2、模型优化及应用: 1)通过指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术优化模型在搜索场景的适应性; 2)探索多模态信息(文本、代码、结构化数据)融合的搜索与生成技术; 3)研究未来生活中的创新应用场景(如个性化知识助手、自动化研究工具),探索技术边界。

更新于 2025-03-18
logo of bytedance
实习A118101

Top Seed人才计划-豆包大模型研究实习生专项:面向 2025年 9 月及以后毕业的博士及本硕在读同学,加入我们,你可以自主决定研究课题,与正式员工享受同等权限和资源,和优秀的研究员一起,向智能上限发起挑战。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、AI搜索总结Agent研发: 1)设计并实现基于LLM的搜索总结Agent,提升搜索结果的理解、推理与结构化总结能力; 2)探索LLM Reasoning技术(如思维链、多步推理),优化复杂查询的Deep Research模式,实现长文本理解与跨文档信息融合; 3)构建端到端系统,涵盖意图识别、知识检索、结果生成与偏好对齐,提升用户体验; 2、模型优化及应用: 1)通过指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术优化模型在搜索场景的适应性; 2)探索多模态信息(文本、代码、结构化数据)融合的搜索与生成技术; 3)研究未来生活中的创新应用场景(如个性化知识助手、自动化研究工具),探索技术边界。

更新于 2025-03-18