字节跳动机器学习算法引擎研发工程师-国际音乐中台
任职要求
1、扎实的C/C++/python编程语言基础,熟悉常用数据结构以及基础算法,对有挑战的工作富有热情; 2、熟悉计算机体系结构和操作系统,具备大型软件/库架构的设计与研发经验的更佳; 3、有很强的分析问题和解决问题的能力,有强烈的责任心。 加分项: 1、在 ACM/NOI/IOI/TopCoder 获奖者优先; 2、有定点量化、指令集优化、深度模型优化等相关项目经验者优先; 3、有CPU,GPU,NPU,ARM,OpenCL,DSP等高性能计算优化经验者优先; 4、有相关音乐识别、音乐理解、对话助手经验的优先; 5、有相关音乐或NLP算法引擎开发经验的优先。
工作职责
负责公司音乐业务相关的算法组件工程化和性能优化相关的算法引擎工作,相关研发技术在抖音、国际化短视频、剪映CapCut、国际化短视频 Music、汽水音乐等产品中应用,满足音乐相关业务场景中的用户不断增长的智能音乐需求,全面提升用户在音乐相关的创作和消费场景的体验。 1、设计和研发业界领先的高性能算法引擎,提供满足音乐识别,音乐理解,大模型自研,大模型应用等场景的核心原子能力; 2、负责深度优化引擎,包括大模型训推加速,向量检索索引优化等常用引擎极致优化; 3、负责算法落地性能评估和分析,制定技术规划和性能标准,持续加强提升关键技术竞争力; 4、相关应用落地,包括音乐识别、音乐理解、对话助手、配乐推荐、音乐电台等。
1、参与国际化短视频搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验; 2、参与国际化短视频搜索算法改进,可选的方向包括: (1)探索前沿NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; (2)跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,使搜索在上述业务中拥有更强大的检索能力;从事视频搜索、视觉搜索等相关算法的研究与开发工作,包括视频内容理解、视觉表征学习、多模态融合等; (3)个性化搜索:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; (4)千亿级数据:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。
1、参与快手大规模深度学习推理引擎、大模型训练解决方案的研发与优化,包括大模型推理、模型训练框架、微调平台等; 2、参与底层算子的优化、通过优化访存pattern、计算提升推理性能,与算法部门合作,为公司大模型定制训练方案,探索RLHF、MoE、多模态、longcontext等前沿方向,提升训练性能; 3、优化推理框架上层调度策略,通过机内、机间的计算任务调度和通讯优化提升引擎性能;优化现有大语言模型相关工具和平台,提高模型训练、维护效率,降低成本,提升训练服务稳定性。
团队介绍:国际化内容安全平台团队致力于为字节跳动国际化产品的用户维护安全可信赖环境,通过开发、迭代机器学习模型和信息系统以更早、更快发掘风险、监控风险、响应紧急事件,以人工智能技术支持业务发展,力求更高效、更敏捷、更全能地维护站内生态安全。 1、负责国际化机审平台服务端研发工作,包括但不限于:规则引擎、策略平台、特征平台、风险感知、风控数据等系统建设; 2、承接视频审核、直播审核、用户审核等核心链路需求开发工作; 3、建设面向亿级日投稿及亿级日活的高并发、高稳定性系统; 4、持续对系统架构进行改造和优化; 5、参与平台产品研发,针对不同流程进行模块抽象。
Bravo 102是由阿里国际技术全团队共同发起的全球顶尖技术人才孵化计划,打破传统人才选拔及培养框架,为有志于走向AI未来的技术新锐们,提供“你行你上+我要我来”的双向奔赴式的实习机会选择。 在这里,“我”将不被岗位定义,以能力选择业务战场,与全球顶尖团队并肩作战,沉浸式体验全球多元化业务战场与亿级流量高并发系统。 加入我们,成为AIDC首批102位Bravo Talent,一起掌舵AI,为我们的未来Bravo! 关于我们: 阿里国际技术专注于提供卓越的数字零售技术服务,致力于服务全球消费者,并触达全球中小企业买家。我们希望利用AI技术让每个人都能够轻松、便捷地享受全球优质的商品和服务,推动商业活动更加高效、可持续,为社会未来的发展带来更多可能性。 我们提供涵盖商品智能、商家服务、供应链优化、跨境物流、搜索推荐引擎、用户增长、金融服务、客户体验、AI 基础设施、企业数智化、全球云及高可用架构、研发效能等技术领域,实习生可跨多个技术域实践,深度参与多场景技术攻坚,探索你想选择的职业发展方向; 在这里,你将和我们一起,采用领先的数字化及人工智能等技术持续解决商业活动中的现实问题,创造技术价值,为消费者带来更加美好的体验!欢迎加入我们! 职位描述: 1、负责大语言模型、图像模型、多模态等深度学习模型的在线推理、离线训练优化工作; 2、负责AI 生态内基础引擎系统能力的建设,包括信息检索、AI 记忆、流程调度等。 3、负责 AI 算法服务能力建设,针对业务场景的真实需求,设计合理的技术方案和路线