logo of bytedance

字节跳动大语言模型应用算法实习生(安全方向)-豆包大模型

实习兼职A41170地点:北京状态:招聘

任职要求


1、本科及以上学历在读,人工智能、计算机、自动化、数学相关专业优先;
2、优秀的代码能力、数据结构和基础算法功底,熟练C/C++Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
3、熟悉NLP、CV相关的算法和技术,熟悉大模型训练、多模态算法者优先;
4、在大模型安全攻防、文本水印、真实性优化等方向有项目经验或论文成果者优先。

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:字节跳动豆包大模型团队(Seed)成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。豆包大模型团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。

1、负责LLM、VLM通用大模型与垂类大模型的内容安全研发,提升模型识别风险、规避风险、处置风险的能力;
2、负责通过定性、定量方法评估策略表现,进行策略迭代更新,不断提升内容安全效果;
3、深度参与大模型、安全、算法等领域的调研,结合通用模型的新技术、新场景,如LongCoT、Agent、GUI,积极探索相应新技术、新场景上,安全方案的创新和落地。
包括英文材料
学历+
数据结构+
算法+
C+
C+++
Python+
Kaggle+
NLP+
大模型+
相关职位

logo of bytedance
实习A114889A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与大语言模型的评测工作,包括但不限于基础能力、FunctionCall、指令遵循、安全等能力维度的评估; 2、深度参与调研和实施将业内前沿、有价值的基准点引入豆包模型的评估体系中; 3、协助设计和执行评测方案,收集和分析评测数据,提供有价值的反馈和建议; 4、跟踪和研究行业内最新的大语言模型技术和评测方法,为团队提供前沿的知识和见解。

更新于 2024-09-14
logo of bytedance
实习A51883

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责千亿级别海量数据的管理,包括数据的存储,数据处理,数据安全,数据校验等等; 2、负责数据链路基建的研发,追求极致的处理速度,达到百万QPS的处理能力; 3、大规模数据的分析以及可视化的建设,从数据中挖掘出影响模型训练结果的可能因素,从而帮助模型训练改进; 4、与算法同学深度合作,加速训练数据的获取,提升数据质量,支持模型结果数据评测,打造数据闭环; 5、支持数据分析和数据可视化工作,降低数据的获取门槛,提升数据的使用价值。

更新于 2024-12-16
logo of alibaba
实习淘天集团日常实习

参与大语言模型的安全性研究,识别模型在实际应用中的潜在风险; 协助设计和实现针对提示攻击、生成内容合规性、对抗样本检测等方面的防御机制; 跟踪前沿大模型安全技术,包括但不限于红队测试、安全评估框架、隐私保护等; 搭建实验环境,进行系统性测试与评估,输出研究报告或技术文档; 与团队协作,支持产品级安全能力的落地与优化。

更新于 2025-06-09
logo of bytedance
实习A121088

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:穿山甲是全球开发者成长平台,依托巨量引擎的技术和产品能力,为开发者提供用户增长、流量变现、LTV提升等全生命周期的服务和成长方案。目前,穿山甲覆盖活跃DAU超过8亿,日均广告请求量超过630亿,日均广告展示量超过110亿,帮助超过10万个app在平台内飞速成长,也为超过10.5万广告主提供了用户增长和投放解决方案。 1、参与广告反作弊大模型的全流程训练,具体包括: 1)预训练: 基于海量广告作弊相关数据,优化反作弊专业领域自适应预训练策略,让大模型具备广告反作弊领域相关的基础知识; 2)指令微调 : 构建反作弊场景的指令数据集,设计多任务微调框架,进一步提升大模型在广告反作弊的具体领域中的效果; 3)强化学习:开发对抗性模拟环境,定义奖励函数,优化RL训练流程,解决复杂的作弊场景所面临的攻防问题; 4)优化分布式训练框架,提升大模型集群训练效率,降低单位算力成本; 2、数据处理与特征工程:负责构建多类型的作弊样本库(如黑产群聊文本、虚假点击时序数据等);同时设计数据自动化检测体系,包含通顺度、逻辑性等的检测,生成高质量的数据集; 3、反作弊大模型评估:建设全面的反作弊大模型评估系统,对不同方案出来的模型能及时、准确的评估效果,并选择最优的模型进行上线; 4、反作弊大模型部署:参与模型轻量化与推理加速,同时满足离线和实时调用的实效需求,追求成本和效率的平衡; 5、跨团队协同:与反作弊策略、技术、业务等各个团队合作,将反作弊大模型应用到各个场景中,实质性的提升业务效果。

更新于 2025-02-28