字节跳动语音大模型平台研发工程师-Data语音
社招全职3年以上A147138地点:杭州状态:招聘
任职要求
1、拥有计算机及相关专业本科及以上学历,3年以上Go、Python项目开发经验; 2、扎实的编程基础、良好的编程风格,熟悉多线程编程、分布式计算、网络通信、内存管理、设计模式; 3、熟悉MLOps相关工作,了解常见语音技术; 4、有强烈的学习欲望,对新技术抱有足够热情和好奇心,热爱AI技术; 5、有强烈的工作责任心,目标导向,结果驱动,业务意识强,具有独立解决问题的能力,良好的协作沟通能力和自驱力; 6、有以下经验者优先:具备AI模型工程和MaaS项目落地经验,具备大规模分布式架构设计开发经验,或者具备丰富的架构设计经验。 加分项: 1、具备AI模型工程和MaaS项目落地经验,涉及模型管理、服务部署、平台自动化相关工作; 2、具备大规模分布式架构设计开发经验,熟悉Hadoop、HDFS、ClickHouse等大数据技术栈; 3、具备丰富的架构设计经验,能够准确、全面的理解业务,并根据业务发展设计合理的架构方案。
工作职责
1、持续推进豆包语音大模型最新技术的工程优化和应用落地; 2、负责设计并实现高可用、可扩展、分布式机器学习平台,支撑多地域语音相关业务模型服务高效迭代更新; 3、与算法、引擎、后端工程师密切配合,理解语音大模型MaaS能力建设和部署运维流程,负责/参与机器学习平台的设计、开发和维护; 4、持续提升平台效率、易用性、降低使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台。
包括英文材料
学历+
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
多线程+
https://liaoxuefeng.com/books/java/threading/basic/index.html
和单线程相比,多线程编程的特点在于:多线程经常需要读写共享数据,并且需要同步。
https://www.youtube.com/watch?v=_uQgGS_VIXM&list=PLsc-VaxfZl4do3Etp_xQ0aQBoC-x5BIgJ
https://www.youtube.com/watch?v=IEEhzQoKtQU
https://www.youtube.com/watch?v=mTGdtC9f4EU&list=PLL8woMHwr36EDxjUoCzboZjedsnhLP1j4
https://www.youtube.com/watch?v=TPVH_coGAQs&list=PLk6CEY9XxSIAeK-EAh3hB4fgNvYkYmghp
https://www.youtube.com/watch?v=xPqnoB2hjjA
This video is an introduction to multithreading in modern C++.
https://www.youtube.com/watch?v=YKBwKy5PrpQ
Rust threading is easy to implement and improves the efficiency of your applications on multi-core systems!
设计模式+
https://liaoxuefeng.com/books/java/design-patterns/index.html
设计模式,即Design Patterns,是指在软件设计中,被反复使用的一种代码设计经验。使用设计模式的目的是为了可重用代码,提高代码的可扩展性和可维护性。
[英文] Design Patterns
https://refactoring.guru/design-patterns
Design patterns are typical solutions to common problems in software design. Each pattern is like a blueprint that you can customize to solve a particular design problem in your code.
https://www.youtube.com/watch?v=NU_1StN5Tkk
Design Patterns tutorial explained in simple words using real-world examples.
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
HDFS+
https://hadoop.apache.org/docs/r1.2.1/hdfs_design.html
The Hadoop Distributed File System (HDFS) is a distributed file system designed to run on commodity hardware.
https://www.ibm.com/cn-zh/think/topics/hdfs
Hadoop 分布式文件系统 (HDFS) 是一种管理大型数据集的文件系统,可在商用硬件上运行。
ClickHouse+
[英文] Advanced Tutorial
https://clickhouse.com/docs/tutorial
Learn how to ingest and query data in ClickHouse using the New York City taxi example dataset.
https://www.youtube.com/watch?v=FtoWGT7kS-c
ClickHouse is an open-source column-oriented DBMS for online analytical processing that allows users to generate analytical reports using SQL queries in real-time.
https://www.youtube.com/watch?v=Rhe-kUyrFUE&list=PL0Z2YDlm0b3gcY5R_MUo4fT5bPqUQ66ep
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
相关职位
社招3年以上A30891
1、持续推进豆包语音大模型最新技术的工程优化和应用落地; 2、负责设计并实现高可用、可扩展、分布式机器学习平台,支撑多地域语音相关业务模型服务高效迭代更新; 3、与算法、引擎、后端工程师密切配合,理解语音大模型MaaS能力建设和部署运维流程,负责/参与机器学习平台的设计、开发和维护; 4、持续提升平台效率、易用性、降低使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台。
更新于 2025-03-28
社招3年以上A204358A
1、持续推进豆包语音大模型最新技术的工程优化和应用落地; 2、负责设计并实现高可用、可扩展、分布式机器学习平台,支撑多地域语音相关业务模型服务高效迭代更新; 3、与算法、引擎、后端工程师密切配合,理解语音大模型MaaS能力建设和部署运维流程,负责/参与机器学习平台的设计、开发和维护; 4、持续提升平台效率、易用性、降低使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台。
更新于 2025-03-28
社招3年以上A242929
1、持续推进豆包语音大模型最新技术的工程优化和应用落地; 2、负责设计并实现高可用、可扩展、分布式机器学习平台,支撑多地域语音相关业务模型服务高效迭代更新; 3、与算法、引擎、后端工程师密切配合,理解语音大模型MaaS能力建设和部署运维流程,负责/参与机器学习平台的设计、开发和维护; 4、持续提升平台效率、易用性、降低使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台。
更新于 2024-11-14