字节跳动大模型应用高级算法研发工程师-隐私和数据保护办公室
社招全职3年以上A50442A地点:上海状态:招聘
任职要求
1、硕士及以上学位,计算机科学、人工智能、数据科学相关专业优先,3年以上大模型平台研发工作经验,对语言大模型、多模态大模型、智能代理Agent技术以及大模型的部署流程有了解和认识; 2、具备熟练的Python/Go语言编程能力和良好的编程习惯和代码管理能力,有参与开发和优化大模型的自动评估技术经历者优先; 3、了解并能够使用常见的深度学习框架如PyTorch以及vLLM等,进行模型的推理和部署,需要具备良好的沟通技巧,能够与业务团队有效沟通,理解业务需求,并将其转化为技术实现; 4、有一定学术背景,发表过优秀文章者优先。
工作职责
1、负责国际化产品机器学习,自然语言处理,大模型算法的开发,LLM Agent的开发,特别是在隐私法律领域的应用,支撑公司相关业务的提效和自动化; 2、设计和实现机器学习,自然语言处理,大模型相关的基础设施、框架、工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习,自然语言处理,大模型相关技术,优化隐私大模型的能力,持续提升平台能力、降低算法使用成本; 4、负责算法模型到API服务的部署,机器学习系统架构设计,工程化落地。
包括英文材料
学历+
数据科学+
https://roadmap.sh/ai-data-scientist
Step by step roadmap guide to becoming an AI and Data Scientist
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
AI agent+
https://www.ibm.com/think/ai-agents
Your one-stop resource for gaining in-depth knowledge and hands-on applications of AI agents.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
编程规范+
[英文] Google Style Guides
https://google.github.io/styleguide/
Every major open-source project has its own style guide: a set of conventions (sometimes arbitrary) about how to write code for that project. It is much easier to understand a large codebase when all the code in it is in a consistent style.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
vLLM+
https://www.newline.co/@zaoyang/ultimate-guide-to-vllm--aad8b65d
vLLM is a framework designed to make large language models faster, more efficient, and better suited for production environments.
https://www.youtube.com/watch?v=Ju2FrqIrdx0
vLLM is a cutting-edge serving engine designed for large language models (LLMs), offering unparalleled performance and efficiency for AI-driven applications.
相关职位
社招A231352
1、负责大模型推理、大规模数据联合分析等场景中的数据安全防护体系构建,结合密码学技术、可信执行环境及系统安全技术,设计兼顾安全与效率的工程化解决方案; 2、开展大模型安全推理、大规模数据联合安全分析的性能优化研究,跟踪前沿安全技术动态,推动密码学跨领域技术融合创新和应用落地。
更新于 2025-02-25
社招2年以上A93989
1、从事机密计算产品Jeddak数据安全沙箱研发,优化沙箱平台的性能、稳定性、可扩展性等,制定技术路线,适配业务发展需求,保障业务稳定增长; 2、研究Intel SGX/TDX、AMD SEV、GPU厂商相关TEE技术的运行机制和底层实现,解决实际业务中的数据安全和隐私保护问题; 3、面向多类应用场景,如机器学习(包括LLM)、数据分析、外包计算等,研发透明可信的数据沙箱产品功能,并持续跟进效果和业务价值; 4、跟踪业界和学术界在机密计算方向上的最新进展,并且能够快速应用到业务中。
更新于 2023-11-20
社招2年以上A42735
1、从事机密计算产品Jeddak数据安全沙箱研发,优化沙箱平台的性能、稳定性、可扩展性等,制定技术路线,适配业务发展需求,保障业务稳定增长; 2、研究Intel SGX/TDX、AMD SEV、GPU厂商相关TEE技术的运行机制和底层实现,解决实际业务中的数据安全和隐私保护问题; 3、面向多类应用场景,如机器学习(包括LLM)、数据分析、外包计算等,研发透明可信的数据沙箱产品功能,并持续跟进效果和业务价值; 4、洞察业界和学术界在机密计算方向上的最新进展,并且能够快速应用到业务中。
更新于 2023-11-20