字节跳动机密/可信计算研究实习生-安全与风控-筋斗云人才计划
任职要求
1、2026届及之后毕业,博士在读,信息安全、网络空间安全、计算机相关专业; 2、优秀的代码能力,熟练使用Python、C/C++、GoLang、Rust一门及以上编程语言; 3、对常见的静动态程序分析技术理解深入,并了解信息流控制等技术; 4、对机密计算、云原生、虚拟化有深入理解,熟悉QEMU、KVM等虚拟化技术,或熟悉TDX、SEV-SNP等机密计算技术; 5、出色的问题分析和解决能力,有自主探索解决方案的能力; 6、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步; 7、在CCS、NDSS、IEEE S&P、USENIX Security等安全顶级会议或期刊上发表论文者优先。
工作职责
团队介绍:字节跳动安全与风控部门,负责公司信息安全的建设、规划和管理工作。致力于为亿万用户的数据安全保驾护航,为字节跳动的每一位用户打造健康自由交流的防护盾。作为企业信息安全的新生力量,以技术为基石,全面提升前瞻性研究和自动化能力。团队积极布局安全人才培养与招募,在北京、上海、深圳、杭州、南京、硅谷、伦敦、新加坡均设有安全研发中心,逐步和信息安全领域的知名高校、研究机构建立深度合作,与安全人才、高校、行业共同努力,建设并反哺互联网安全生态。 课题背景: 新型可信隐私计算特点在于其融合了软件密码学以及可信硬件技术,能够在数据“可用不可见、可算不可识、可管可计量”的基础上,支持海量数据的计算分析以及大模型的训练和推理,提供透明可信的计算环境,保障用户数据的隐私安全; 但是,在工业级的实际场景中,可信隐私计算技术的应用面临着诸多难题,包括安全计算性能的提升、云原生环境的适配以及信任体系的构建。例如,1)面对十亿甚至百亿规模的海量数据,以及大模型动辄数十B的参数,安全多方计算、同态加密技术由于高昂计算与通信开销,使得其比明文计算慢上百倍甚至千倍;2)作为云原生基础技术的容器,与机密计算结合时面临着可信计算基(TCB)过大、攻击面失控、横向逃逸、可运维性差等问题;3)机密计算虽可有效保护应用的完整性,但是完整性并不等同于安全性,应用仍可能存在漏洞或泄露用户隐私。 1、在百亿至千亿量级的数据查询分析和大模型训练推理场景下,如何从时间、空间、通信等维度,结合可信硬件、专用加速器等手段,设计高性能、可实用的安全多方计算数据分析与机器学习算法、范式以及系统框架; 2、实现机密容器技术体系,从内核、操作系统、根文件系统等维度合理地减少攻击面,同时提高可信性的可证明性、可信容器的可运维性以及可靠的容器隔离性,防御恶意逃逸行为; 3、针对机密计算应用特点,实现可用高效、范化性强(多语言支持)、具备数据泄漏追踪能力的通用可信程序分析框架,提升机密计算环境可信性。
团队介绍:字节跳动安全与风控部门,负责公司信息安全的建设、规划和管理工作。致力于为亿万用户的数据安全保驾护航,为字节跳动的每一位用户打造健康自由交流的防护盾。作为企业信息安全的新生力量,以技术为基石,全面提升前瞻性研究和自动化能力。团队积极布局安全人才培养与招募,在北京、上海、深圳、杭州、南京、硅谷、伦敦、新加坡均设有安全研发中心,逐步和信息安全领域的知名高校、研究机构建立深度合作,与安全人才、高校、行业共同努力,建设并反哺互联网安全生态。 课题背景: 新型可信隐私计算特点在于其融合了软件密码学以及可信硬件技术,能够在数据“可用不可见、可算不可识、可管可计量”的基础上,支持海量数据的计算分析以及大模型的训练和推理,提供透明可信的计算环境,保障用户数据的隐私安全; 但是,在工业级的实际场景中,可信隐私计算技术的应用面临着诸多难题,包括安全计算性能的提升、云原生环境的适配以及信任体系的构建。例如,1)面对十亿甚至百亿规模的海量数据,以及大模型动辄数十B的参数,安全多方计算、同态加密技术由于高昂计算与通信开销,使得其比明文计算慢上百倍甚至千倍;2)作为云原生基础技术的容器,与机密计算结合时面临着可信计算基(TCB)过大、攻击面失控、横向逃逸、可运维性差等问题;3)机密计算虽可有效保护应用的完整性,但是完整性并不等同于安全性,应用仍可能存在漏洞或泄露用户隐私。 1、在百亿至千亿量级的数据查询分析和大模型训练推理场景下,如何从时间、空间、通信等维度,结合可信硬件、专用加速器等手段,设计高性能、可实用的安全多方计算数据分析与机器学习算法、范式以及系统框架; 2、实现机密容器技术体系,从内核、操作系统、根文件系统等维度合理地减少攻击面,同时提高可信性的可证明性、可信容器的可运维性以及可靠的容器隔离性,防御恶意逃逸行为; 3、针对机密计算应用特点,实现可用高效、范化性强(多语言支持)、具备数据泄漏追踪能力的通用可信程序分析框架,提升机密计算环境可信性。
团队介绍:字节跳动安全与风控部门,负责公司信息安全的建设、规划和管理工作。致力于为亿万用户的数据安全保驾护航,为字节跳动的每一位用户打造健康自由交流的防护盾。作为企业信息安全的新生力量,以技术为基石,全面提升前瞻性研究和自动化能力。团队积极布局安全人才培养与招募,在北京、上海、深圳、杭州、南京、硅谷、伦敦、新加坡均设有安全研发中心,逐步和信息安全领域的知名高校、研究机构建立深度合作,与安全人才、高校、行业共同努力,建设并反哺互联网安全生态。 课题介绍: 新型可信隐私计算特点在于其融合了软件密码学以及可信硬件技术,能够在数据“可用不可见、可算不可识、可管可计量”的基础上,支持海量数据的计算分析以及大模型的训练和推理,提供透明可信的计算环境,保障用户数据的隐私安全; 但是,在工业级的实际场景中,可信隐私计算技术的应用面临着诸多难题,包括安全计算性能的提升、云原生环境的适配以及信任体系的构建。例如,1)面对十亿甚至百亿规模的海量数据,以及大模型动辄数十B的参数,安全多方计算、同态加密技术由于高昂计算与通信开销,使得其比明文计算慢上百倍甚至千倍;2)作为云原生基础技术的容器,与机密计算结合时面临着可信计算基(TCB)过大、攻击面失控、横向逃逸、可运维性差等问题;3)机密计算虽可有效保护应用的完整性,但是完整性并不等同于安全性,应用仍可能存在漏洞或泄露用户隐私。 1、在百亿至千亿量级的数据查询分析和大模型训练推理场景下,如何从时间、空间、通信等维度,结合可信硬件、专用加速器等手段,设计高性能、可实用的安全多方计算数据分析与机器学习算法、范式以及系统框架; 2、实现机密容器技术体系,从内核、操作系统、根文件系统等维度合理地减少攻击面,同时提高可信性的可证明性、可信容器的可运维性以及可靠的容器隔离性,防御恶意逃逸行为; 3、针对机密计算应用特点,实现可用高效、范化性强(多语言支持)、具备数据泄漏追踪能力的通用可信程序分析框架,提升机密计算环境可信性。
团队介绍:字节跳动安全与风控部门,负责公司信息安全的建设、规划和管理工作。致力于为亿万用户的数据安全保驾护航,为字节跳动的每一位用户打造健康自由交流的防护盾。作为企业信息安全的新生力量,以技术为基石,全面提升前瞻性研究和自动化能力。团队积极布局安全人才培养与招募,在北京、上海、深圳、杭州、南京、硅谷、伦敦、新加坡均设有安全研发中心,逐步和信息安全领域的知名高校、研究机构建立深度合作,与安全人才、高校、行业共同努力,建设并反哺互联网安全生态。 课题介绍: 新型可信隐私计算特点在于其融合了软件密码学以及可信硬件技术,能够在数据“可用不可见、可算不可识、可管可计量”的基础上,支持海量数据的计算分析以及大模型的训练和推理,提供透明可信的计算环境,保障用户数据的隐私安全; 但是,在工业级的实际场景中,可信隐私计算技术的应用面临着诸多难题,包括安全计算性能的提升、云原生环境的适配以及信任体系的构建。例如,1)面对十亿甚至百亿规模的海量数据,以及大模型动辄数十B的参数,安全多方计算、同态加密技术由于高昂计算与通信开销,使得其比明文计算慢上百倍甚至千倍;2)作为云原生基础技术的容器,与机密计算结合时面临着可信计算基(TCB)过大、攻击面失控、横向逃逸、可运维性差等问题;3)机密计算虽可有效保护应用的完整性,但是完整性并不等同于安全性,应用仍可能存在漏洞或泄露用户隐私。 1、在百亿至千亿量级的数据查询分析和大模型训练推理场景下,如何从时间、空间、通信等维度,结合可信硬件、专用加速器等手段,设计高性能、可实用的安全多方计算数据分析与机器学习算法、范式以及系统框架; 2、实现机密容器技术体系,从内核、操作系统、根文件系统等维度合理地减少攻击面,同时提高可信性的可证明性、可信容器的可运维性以及可靠的容器隔离性,防御恶意逃逸行为; 3、针对机密计算应用特点,实现可用高效、范化性强(多语言支持)、具备数据泄漏追踪能力的通用可信程序分析框架,提升机密计算环境可信性。
现有数据库系统默认部署于可信任的物理环境、由可信任的数据库管理员进行管理,在非可信环境下的数据安全能力一直没有作为主要需求在系统设计中予以考虑。这样的系统设定下,在如今业务链路复杂化、三方数据托管服务、跨组织数据流通等场景下难以保障数据库内数据的机密性、完整性、隐私性等问题。因此,数据库系统亟需面向非可信部署环境,探索构建内置原生的数据安全可信能力,从而保护用户数据资产的全方位安全。 针对上述场景,我们从机密计算、区块链、隐私计算等技术方向入手,探索数据库系统与这些新兴安全技术的融合设计与系统架构,包括但不限于: 1、如何结合可信执行环境、同态加密等技术,构建只处理用户密文数据的数据库管理系统; 2、如何结合区块链、可验证数据结构等技术,构建防止用户数据、日志等被篡改的数据库管理系统; 3、如何结合多方安全计算、差分隐私等技术,构建支持跨数据库安全联合分析的数据库管理系统。