
奇虎360实习转正-AI算法安全研究实习生(北京)-5013(J11867)
任职要求
1、博士学历; 2、熟练掌握Python,熟悉Linux 环境开发,熟练使用深度学习框架TensorFlow或者PyTorch; 3、熟悉一项或者多项以下技术:LLM预训练、对话管理、Instruction Tuning、强…
工作职责
1、负责LLM训练相关的工作,包括基础预训练、SFT以及强化学习等; 2、负责优化LLM在具体产品场景下的微调,能够完成技术在产品的落地; 3、探索LLM高效学习的方式,包括叠加数据训练、PPO优化方式等; 4、跟进前沿技术, 并把相应技术落地。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:团队负责公司多个跨产品业务方向,提供可复用的平台能力及技术解决方案。我们为公司多业务提供如地理位置、行业数据等多类型的中台能力与技术解决方案,积极利用AI等技术做中台能力提效与升级。 加入我们,你将有机会从中台的多视角参与业务建设,感受不同类型/阶段的业务特点;通过用户场景的开发&架构工作,学习和解决极富挑战的技术问题;你也可以从数据出发,积极利用策略和模型,为业务提供有价值的助力。 1、进行安全新技术研究,输出研究报告,为业务部门提供参考; 2、协助分析客户端产品各种安全问题(例如数据加解密算法和数据传输协议等),提出解决方案并推动落地。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:集团信息系统部(Corporate Information System)负责字节跳动信息系统建设。通过构建领先的信息系统,助力公司业务和组织的长期高效经营与发展。与此同时,在安全、隐私、合规层面持续治理,为公司的稳健发展保驾护航。字节跳动的业务模式复杂,用户规模大。到现在,集团信息系统部已经覆盖人事、财务、法务、采购、审批、职场等多个领域,隐私安全工作同步开展,AIGC创新孵化也在逐步落地实现。 1、负责AI应用的算法研发和LLM效果优化工作,推动最前沿技术的探索和应用; 2、探索大语言模型等先进AI技术在字节跳动国际化公司运营的落地,包括领域预训练、SFT、RL、训练和推理加速、模型评测等技术; 3、提升大语言模型领域模型知识、逻辑理解的能力、工具编排能力、规划能力;应用于对话系统、检索问答、领域Agent搭建等方向; 4、提升多模态识别和理解能力,比如图片、音频、视频等多模态分类、内容挖掘、理解和生成等。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、承担抖音内多元语音交互场景中的语音模型需求,涵盖抖音AI分身音视频对话、客服热线、VOIP场景下的相关音频算法研发工作;包括对语音识别、合成、对话理解等模型展开针对性训练与优化,全力提升对话效果及语音合成稳定性和表现力; 2、深入探索端到端语音大模型的落地与优化举措,致力于降低语音交互延时,显著提升语音对话品质;同时,专注于语音合成/音频AI生成相关算法模型的研发与精进,跟进语音领域前沿技术研究,负责音频表征模型、Seq2Seq底膜的研发优化; 3、紧密跟踪研发业界先进的音频技术进展,积极探索语音/音频领域最新技术,并推动其成功落地于抖音产品之中。