字节跳动后端研发工程师-抖音生态与运营 (北京/上海/杭州/厦门)
任职要求
1、硬性能力: 1)计算机相关专业本科及以上学历,扎实的算法与数据结构基础; 2)精通Golang/Java/Python至少一门语言,熟悉Linux开发环境与网络编程; 3)深入理解分布式系统原理,掌握微服务、CAP理论、分布式事务等核心概念; 4)熟悉MySQL/Redis/Kafka等组件的高可用架构与调优策略; 5)具备复杂业务系统设计经验,能独立完成技术方案设计与核心代码开发; 2、高阶能力: 1)资金安全/内容安全系统建设; 2)流程引擎/规则引擎开发; 3)DDD领域驱动设计实践; 4)大数据处理…
工作职责
1、深耕抖音创作者生态与运营体系,业务方向包括但不限于: 1)创作者中心(创作者成长、内容管理、数据分析、激励分成等); 2)运营平台(运营工作流、活动配置、资源投放、数据监控、活动管理等); 3)版权管理(短剧管理、内容版权保护、版权识别、侵权治理等); 4)生态治理(原创、营销感治理、低质治理等); 2、业务开发与系统建设: 1)负责抖音生态业务系统(创作者中心/运营平台/版权平台/生态治理等)的设计与开发,支撑亿级用户场景; 2)主导高并发分布式架构设计,应对百亿级流量挑战,保障系统高可用性与稳定性; 3)建设通用服务组件与中间件,提升研发效能与系统扩展性; 3、技术架构与性能优化: 1)持续优化MySQL/Redis/MQ等核心组件性能,设计容灾监控体系与自动化运维方案; 2)推进服务化/异步化架构演进,解决复杂业务场景下的数据一致性、服务降级等挑战; 3)主导系统性能调优,包括Golang运行时调优等; 4、创新探索与前沿技术落地: 1)探索大模型、AIGC等技术在业务场景的应用(如智能审核、自动化运营、数据洞察); 2)研发低代码平台、规则引擎等解决方案,赋能B端复杂业务流程; 3)推动算法工程化落地,构建高吞吐、低延迟的实时数据处理系统。
1、深耕抖音创作者生态与运营体系,业务方向包括但不限于: 1)创作者中心(创作者成长、内容管理、数据分析、激励分成等); 2)运营平台(运营工作流、活动配置、资源投放、数据监控、活动管理等); 3)版权管理(短剧管理、内容版权保护、版权识别、侵权治理等); 4)生态治理(原创、营销感治理、低质治理等); 2、业务开发与系统建设: 1)负责抖音生态业务系统(创作者中心/运营平台/版权平台/生态治理等)的设计与开发,支撑亿级用户场景; 2)主导高并发分布式架构设计,应对百亿级流量挑战,保障系统高可用性与稳定性; 3)建设通用服务组件与中间件,提升研发效能与系统扩展性; 3、技术架构与性能优化: 1)持续优化MySQL/Redis/MQ等核心组件性能,设计容灾监控体系与自动化运维方案; 2)推进服务化/异步化架构演进,解决复杂业务场景下的数据一致性、服务降级等挑战; 3)主导系统性能调优,包括Golang运行时调优等; 4、创新探索与前沿技术落地: 1)探索大模型、AIGC等技术在业务场景的应用(如智能审核、自动化运营、数据洞察); 2)研发低代码平台、规则引擎等解决方案,赋能B端复杂业务流程; 3)推动算法工程化落地,构建高吞吐、低延迟的实时数据处理系统。
1、深耕抖音创作者生态与运营体系,业务方向包括但不限于: 1)创作者中心(创作者成长、内容管理、数据分析、激励分成等); 2)运营平台(运营工作流、活动配置、资源投放、数据监控、活动管理等); 3)版权管理(短剧管理、内容版权保护、版权识别、侵权治理等); 4)生态治理(原创、营销感治理、低质治理等); 2、业务开发与系统建设: 1)负责抖音生态业务系统(创作者中心/运营平台/版权平台/生态治理等)的设计与开发,支撑亿级用户场景; 2)主导高并发分布式架构设计,应对百亿级流量挑战,保障系统高可用性与稳定性; 3)建设通用服务组件与中间件,提升研发效能与系统扩展性; 3、技术架构与性能优化: 1)持续优化MySQL/Redis/MQ等核心组件性能,设计容灾监控体系与自动化运维方案; 2)推进服务化/异步化架构演进,解决复杂业务场景下的数据一致性、服务降级等挑战; 3)主导系统性能调优,包括Golang运行时调优等; 4、创新探索与前沿技术落地: 1)探索大模型、AIGC等技术在业务场景的应用(如智能审核、自动化运营、数据洞察); 2)研发低代码平台、规则引擎等解决方案,赋能B端复杂业务流程; 3)推动算法工程化落地,构建高吞吐、低延迟的实时数据处理系统。
1、深耕抖音创作者生态与运营体系,业务方向包括但不限于: 1)创作者中心(创作者成长、内容管理、数据分析、激励分成等); 2)运营平台(运营工作流、活动配置、资源投放、数据监控、活动管理等); 3)版权管理(短剧管理、内容版权保护、版权识别、侵权治理等); 4)生态治理(原创、营销感治理、低质治理等); 2、业务开发与系统建设: 1)负责抖音生态业务系统(创作者中心/运营平台/版权平台/生态治理等)的设计与开发,支撑亿级用户场景; 2)主导高并发分布式架构设计,应对百亿级流量挑战,保障系统高可用性与稳定性; 3)建设通用服务组件与中间件,提升研发效能与系统扩展性; 3、技术架构与性能优化: 1)持续优化MySQL/Redis/MQ等核心组件性能,设计容灾监控体系与自动化运维方案; 2)推进服务化/异步化架构演进,解决复杂业务场景下的数据一致性、服务降级等挑战; 3)主导系统性能调优,包括Golang运行时调优等; 4、创新探索与前沿技术落地: 1)探索大模型、AIGC等技术在业务场景的应用(如智能审核、自动化运营、数据洞察); 2)研发低代码平台、规则引擎等解决方案,赋能B端复杂业务流程; 3)推动算法工程化落地,构建高吞吐、低延迟的实时数据处理系统。
大模型具备很强的泛化及理解世界能力,在小红书内的众多生产场景遍地开花,大模型的训练和部署已成为许多算法工程师的日常。在多团队、多业务频繁使用的大规模GPU集群上,如何能够通过高效的GPU调度策略,使大家不仅能丝滑地完成训练及部署任务,同时也能充分激发大规模GPU集群的效能,是行业公认的关键挑战。在这里,你可以聚焦LLM场景,接触到超大规模GPU集群,并使用真实负载数据进行深入分析及技术探索。欢迎加入我们,一起探索领先技术改变世界! 工作职责: 1、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、集群调度、GPU虚拟化、故障快速恢复、存储&网络加速等手段,提升大规模GPU集群的整体使用效率。 2、负责构建面向大模型训练、微调、推理、部署全流程LLMOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地。 3、持续关注业界最新的GPU资源调度相关技术动态,探索建设业界领先的资源调度策略及方法,构建下一代大规模AI资源调度系统。