字节跳动AIGC 服务端工程师(数据平台)-剪映CapCut(广州)
社招全职SYEP地点:广州状态:招聘
任职要求
1、本科及以上学历,计算机、通信等相关专业优先; 2、有丰富的AI相关离线数据加工、治理经验,对大数据套件或者Ray分布式框架较为了解,有数据服务、高并发服务实践和设计经验为佳; 3、对利用各类数据驱动模型迭代/优化的工作感兴趣,有实际相关数据作业经验为佳,对外部数据获取有技术实战经验为佳; 4、具备强烈的责任心、良好的沟通协作能力,拥有独立解决问题的能力,能积极推动事情落地; 5、有AI或者大模型相关背景经验加分。
工作职责
1、负责剪映CapCut AI数据工程与系统,同算法、产品团队协作完成稳健高效的数据处理Pipeline和系统的设计和研发,支持数据的生产、管理以及洞察等,助力算法模型快速迭代; 2、负责搭建模型效果评测体系与系统,支持多层级和多类型AIGC模型评测,以及测试集的构建、管理等,快速评估和优化模型以及端到端链路效果; 3、负责构建算法迭代自动化系统,提高数据驱动的模型迭代效率,以及使用Prompt Engineering和RAG等技术来提高模型和产品效果等; 4、负责构建统一的数据框架和基座,结合Data-Centric AI的理念,为剪映Capcut多个业务场景打造通用可靠的数据体系,推动业务快速发展。
包括英文材料
学历+
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Ray+
https://github.com/ray-project/ray
Ray consists of a core distributed runtime and a set of AI Libraries for accelerating ML workloads.
https://www.youtube.com/watch?v=FhXfEXUUQp0
In this video, I'll teach you everything you need to know about Apache Ray!
https://www.youtube.com/watch?v=fMiAyj2kgac
Using powerful machine learning algorithms is easy using Ray.io and Python.
https://www.youtube.com/watch?v=q_aTbb7XeL4
Parallel and Distributed computing sounds scary until you try this fantastic Python library.
高并发+
https://www.baeldung.com/concurrency-principles-patterns
In this tutorial, we’ll discuss some of the design principles and patterns that have been established over time to build highly concurrent applications.
https://www.baeldung.com/java-concurrency
Handling concurrency in an application can be a tricky process with many potential pitfalls. A solid grasp of the fundamentals will go a long way to help minimize these issues.
https://www.oreilly.com/library/view/concurrency-in-go/9781491941294/
You’ll understand how Go chooses to model concurrency, what issues arise from this model, and how you can compose primitives within this model to solve problems.
https://www.oreilly.com/library/view/modern-concurrency-in/9781098165406/
With this book, you'll explore the transformative world of Java 21's key feature: virtual threads.
https://www.youtube.com/watch?v=qyM8Pi1KiiM
https://www.youtube.com/watch?v=wEsPL50Uiyo
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
相关职位
社招3年以上O7402
1、负责剪映AI应用项目和平台工具的工程研发,结合各类AI技术特点,发挥想象力与创造性,落地有价值的AI应用场景,打造极致的用户体验; 2、研发高并发,高可靠,灵活扩展并支持国际化部署的服务端系统,满足复杂业务场景的需求; 3、研发AI应用基础服务组件,解决共性需求,减少重复开发; 4、AI应用领域的新技术研究和应用,推动适合的技术应用于生产。
更新于 2022-09-29
社招4年以上A94909
1、负责剪映AIGC基建能力开发,聚焦于解决AI相关的开发效率、能力复用及评测等方面; 2、研发高并发、高可靠、灵活扩展并支持国际化部署的服务端系统,满足复杂业务场景的需求; 3、通过调研和应用前沿的技术架构和先进实践,结合场景打造强大的研发和服务基础设施,推动剪映Capcut的AI产品快速发展; 4、搭建一体化平台,通过可视化、低代码等方式提供易用易管理的基建能力。
更新于 2023-11-09
社招1年以上A147107
团队介绍:剪映商业化服务端工程团队主要负责剪映Capcut、醒图,以及AIGC产品在内的商业化业务开发工作。我们围绕权益供给、商品支付、权益消费、广告分发优化等方向,做好业务场景抽象、平台化、架构设计,支持剪映Capcut全球商业化的快速增长,并给团队成员提供充分的成长自我机会。 1、权益供给:负责商业资源的权益设计实现、分发等相关工作; 2、权益交易:负责商品、订单、发货等核心环节,提升支付转化率等; 3、权益消费:负责管理用户商业化数据,聚焦于权益消费、用户营销等相关环节; 4、广告工程:负责广告的分发、配置下发、用户体验保障等相关工作。
更新于 2023-08-03