字节跳动豆包AI应用工程师-Data
社招全职A10537B地点:北京状态:招聘
任职要求
1、精通Python的编程技能,并有构建生产应用程序的经验,具备在Linux开发环境下的开发能力,熟悉至少一种主流大模型应用框架(如LangChain、LlamaIndex或OpenAI AgentsSDK); 2、对大模型有较深入的理解,熟悉常见的LLM实施模式、提示工程、评估框架、代理框架和检索框架等; 3、熟悉模型的Postraining流程,能够帮助和指导客户进行SFT或者RL相关的训练优化; 4、具备强大的技术沟通能力,能够创建可扩展的内容(文档、教程、示例代码),同时有较强的项目管理能力和多团队协同能力; 5、熟悉海内外大模型服务,有AI算法相关领域技术背景、AI Native产品工作经验的优先。
工作职责
1、与解决方案产品经理合作,深入理解初创企业的需求并设计技术解决方案,确保商业目标与技术实施之间的一致性; 2、了解豆包大模型家族的模型特性,能够设计和开发AI应用程序和原型,验证产品概念和需求,展示企业用例的大模型集成模式; 3、在企业采用豆包大模型的整个过程中,作为主要的技术负责人,协调内部多个团队以推动客户成功; 4、分析和定位模型能力缺陷,协助构建模型评测,帮助算法和数据团队推进模型迭代; 5、帮助企业开发轻量级评估框架和测试套件,以衡量豆包大模型对其特定用例的性能。
包括英文材料
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
LangChain+
https://python.langchain.com/docs/tutorials/
New to LangChain or LLM app development in general? Read this material to quickly get up and running building your first applications.
https://www.freecodecamp.org/news/beginners-guide-to-langchain/
LangChain is a popular framework for creating LLM-powered apps.
LlamaIndex+
https://developers.llamaindex.ai/python/framework/getting_started/starter_example/
This tutorial will show you how to get started building agents with LlamaIndex.
https://www.ibm.com/think/tutorials/llamaindex-rag
LlamaIndex is a powerful open source framework that simplifies the process of building RAG pipelines.
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
相关职位
校招A67478
团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、专注改进大模型在现实世界复杂任务的效果,追求通用可规模化的方法,包括不限于复杂推理、多模态、自主Agent、以及可扩展监督和大规模数据合成等方法; 2、推动大模型技术在高难度场景中的前沿应用,包括不限于Agent系统、专业咨询、科研协作、深度洞察、个性化教育等高价值场景; 3、面向广泛的现实世界高价值任务,设计科学、严谨的量化评测体系,提升模型的智能水平。
更新于 2025-08-04
社招3年以上A147138
1、持续推进豆包语音大模型最新技术的工程优化和应用落地; 2、负责设计并实现高可用、可扩展、分布式机器学习平台,支撑多地域语音相关业务模型服务高效迭代更新; 3、与算法、引擎、后端工程师密切配合,理解语音大模型MaaS能力建设和部署运维流程,负责/参与机器学习平台的设计、开发和维护; 4、持续提升平台效率、易用性、降低使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台。
更新于 2025-03-28
社招3年以上A30891
1、持续推进豆包语音大模型最新技术的工程优化和应用落地; 2、负责设计并实现高可用、可扩展、分布式机器学习平台,支撑多地域语音相关业务模型服务高效迭代更新; 3、与算法、引擎、后端工程师密切配合,理解语音大模型MaaS能力建设和部署运维流程,负责/参与机器学习平台的设计、开发和维护; 4、持续提升平台效率、易用性、降低使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台。
更新于 2025-03-28