logo of bytedance

字节跳动大模型算法工程实习生-隐私和数据保护办公室

实习兼职A117885A地点:上海状态:招聘

任职要求


1、本科及以上学历在读,计算机科学、人工智能、数据科学相关专业优先;
2、实习期至少3个月,每周至少四天;具备基础的机器学习深度学习知识,能够理解常用算法和模型;有使用大模型及进行Prompt优化的实践经验;参与过后端开发,了解常见流程;
3、具备后端开发技能,熟悉一种后端编程语言如Node.jsJava、或C++;有RESTful API开发经验者优先;有使用大模型及进行Prompt优化的实践经验;
4、参与过机器学习深度学习相关的实习、课程项目或个人项目;在开源项目中有贡献,有参与大模型(如GPTBERT)优化经验者优先;
5、具有较强的分析和解决问题的能力,良好的团队合作精神和沟通能力,快速学习和应用新技术的能力。

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:隐私和数据保护办公室,负责与法律/安全/Eng/Prod/OPs团队合作,在隐私和数据保护领域支持字节跳动相关国际化产品。

1、优化大模型Prompt,提高模型的响应质量和准确性;学习并应用最新的算法和技术,提高模型的性能;
2、清理、处理和准备用于训练和验证的海量数据集,确保数据质量和一致性,为模型训练提供可靠的数据基础;
3、进行模型的训练和测试,参与数据标注和结果分析;实验新算法和模型结构,记录和分析实验结果;
4、开发和维护与模型相关的后端服务和API,实现高效的服务器端代码,确保系统的稳定性和高效性;
5、提供技术支持,解决模型在实际应用中的问题;撰写技术文档,总结实验结果和经验教训。
包括英文材料
学历+
数据科学+
机器学习+
深度学习+
算法+
大模型+
Prompt+
后端开发+
JavaScript+
Node.js+
Java+
C+++
GPT+
BERT+
相关职位

logo of bytedance
实习A127478A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动安全与风控-Flow部门,负责Flow业务中大模型和生成式AI应用如豆包、Cici、扣子等的安全保障工作。团队为业务面临的数据安全、用户隐私挑战、新兴大模型攻击方式等安全隐患提供创新的防御能力和解决方案,我们在北京、杭州、深圳、美国均设有安全研发中心,团队和业务正处于快速发展期,成长空间大,欢迎各位同学加入。 1、参与大模型应用的隐私安全项目实施,确保大模型应用的隐私保护合规; 2、参与数据匿名化、数据加密、机密计算等安全能力研发,为业务线提供坚实的数据安全底座; 3、数据安全、隐私保护有效性验证:系统性的发掘产品中数据安全、隐私保护风险,并针对性的给出解决方案。

更新于 2025-01-06
logo of bytedance
实习A242576A

团队介绍:字节跳动安全与风控部门,负责公司信息安全的建设、规划和管理工作。致力于为亿万用户的数据安全保驾护航,为字节跳动的每一位用户打造健康自由交流的防护盾。作为企业信息安全的新生力量,以技术为基石,全面提升前瞻性研究和自动化能力。团队积极布局安全人才培养与招募,在北京、上海、深圳、杭州、南京、硅谷、伦敦、新加坡均设有安全研发中心,逐步和信息安全领域的知名高校、研究机构建立深度合作,与安全人才、高校、行业共同努力,建设并反哺互联网安全生态。 课题介绍: 新型可信隐私计算特点在于其融合了软件密码学以及可信硬件技术,能够在数据“可用不可见、可算不可识、可管可计量”的基础上,支持海量数据的计算分析以及大模型的训练和推理,提供透明可信的计算环境,保障用户数据的隐私安全; 但是,在工业级的实际场景中,可信隐私计算技术的应用面临着诸多难题,包括安全计算性能的提升、云原生环境的适配以及信任体系的构建。例如,1)面对十亿甚至百亿规模的海量数据,以及大模型动辄数十B的参数,安全多方计算、同态加密技术由于高昂计算与通信开销,使得其比明文计算慢上百倍甚至千倍;2)作为云原生基础技术的容器,与机密计算结合时面临着可信计算基(TCB)过大、攻击面失控、横向逃逸、可运维性差等问题;3)机密计算虽可有效保护应用的完整性,但是完整性并不等同于安全性,应用仍可能存在漏洞或泄露用户隐私。 1、在百亿至千亿量级的数据查询分析和大模型训练推理场景下,如何从时间、空间、通信等维度,结合可信硬件、专用加速器等手段,设计高性能、可实用的安全多方计算数据分析与机器学习算法、范式以及系统框架; 2、实现机密容器技术体系,从内核、操作系统、根文件系统等维度合理地减少攻击面,同时提高可信性的可证明性、可信容器的可运维性以及可靠的容器隔离性,防御恶意逃逸行为; 3、针对机密计算应用特点,实现可用高效、范化性强(多语言支持)、具备数据泄漏追踪能力的通用可信程序分析框架,提升机密计算环境可信性。

更新于 2025-02-26
logo of bytedance
实习A177251

团队介绍:字节跳动安全与风控部门,负责公司信息安全的建设、规划和管理工作。致力于为亿万用户的数据安全保驾护航,为字节跳动的每一位用户打造健康自由交流的防护盾。作为企业信息安全的新生力量,以技术为基石,全面提升前瞻性研究和自动化能力。团队积极布局安全人才培养与招募,在北京、上海、深圳、杭州、南京、硅谷、伦敦、新加坡均设有安全研发中心,逐步和信息安全领域的知名高校、研究机构建立深度合作,与安全人才、高校、行业共同努力,建设并反哺互联网安全生态。 课题介绍: 新型可信隐私计算特点在于其融合了软件密码学以及可信硬件技术,能够在数据“可用不可见、可算不可识、可管可计量”的基础上,支持海量数据的计算分析以及大模型的训练和推理,提供透明可信的计算环境,保障用户数据的隐私安全; 但是,在工业级的实际场景中,可信隐私计算技术的应用面临着诸多难题,包括安全计算性能的提升、云原生环境的适配以及信任体系的构建。例如,1)面对十亿甚至百亿规模的海量数据,以及大模型动辄数十B的参数,安全多方计算、同态加密技术由于高昂计算与通信开销,使得其比明文计算慢上百倍甚至千倍;2)作为云原生基础技术的容器,与机密计算结合时面临着可信计算基(TCB)过大、攻击面失控、横向逃逸、可运维性差等问题;3)机密计算虽可有效保护应用的完整性,但是完整性并不等同于安全性,应用仍可能存在漏洞或泄露用户隐私。 1、在百亿至千亿量级的数据查询分析和大模型训练推理场景下,如何从时间、空间、通信等维度,结合可信硬件、专用加速器等手段,设计高性能、可实用的安全多方计算数据分析与机器学习算法、范式以及系统框架; 2、实现机密容器技术体系,从内核、操作系统、根文件系统等维度合理地减少攻击面,同时提高可信性的可证明性、可信容器的可运维性以及可靠的容器隔离性,防御恶意逃逸行为; 3、针对机密计算应用特点,实现可用高效、范化性强(多语言支持)、具备数据泄漏追踪能力的通用可信程序分析框架,提升机密计算环境可信性。

更新于 2025-02-26
logo of bytedance
实习A201456

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动安全与风控-Flow部门,负责Flow业务中大模型和生成式AI应用如豆包、Cici、扣子等的安全保障工作。团队为业务面临的数据安全、用户隐私挑战、新兴大模型攻击方式等安全隐患提供创新的防御能力和解决方案,我们在北京、杭州、深圳、美国均设有安全研发中心,团队和业务正处于快速发展期,成长空间大,欢迎各位同学加入。 1、参与大模型应用的隐私安全项目实施,确保大模型应用的隐私保护合规; 2、参与数据匿名化、数据加密、机密计算等安全能力研发,为业务线提供坚实的数据安全底座; 3、数据安全、隐私保护有效性验证:系统性的发掘产品中数据安全、隐私保护风险,并针对性的给出解决方案。

更新于 2025-02-20