快手C++推荐系统工程师【国际化】-算法引擎部
任职要求
1、具备扎实的C++编码功底,有很强的工程能力和良好的代码风格; 2、具备扎实的算法和数据结构基础; 3、熟练掌握服务性能分析与优化技能和工具; 4、具备很强的上进心,责任感,不断自主推进服务的迭代演进;目前业务处于高速发展…
工作职责
1、设计与搭建服务海外多国家的个性化推荐策略框架,优化性能,提升稳定性和迭代效率; 2、参与大规模分布式推荐策略服务的搭建和优化; 3、参与大规模分布式在线机器学习平台(模型训练和预估)的搭建; 4、参与分布式存储平台(用户画像、分布式索引)的开发。
Bravo 102是由阿里国际技术全团队共同发起的技术人才孵化计划,打破传统人才选拔及培养框架,为有志于走向AI未来的技术新锐们,提供“你行你上+我要我来”的双向奔赴式的实习机会选择。 在这里,“我”将不被岗位定义,以能力选择业务战场,与全球顶尖团队并肩作战,沉浸式体验全球多元化业务战场与亿级流量高并发系统。 加入我们,成为AIDC首批102位Bravo Talent,一起掌舵AI,为我们的未来Bravo! 关于我们: 阿里国际技术专注于提供卓越的数字零售技术服务,致力于服务全球消费者,并触达全球中小企业买家。我们希望利用AI技术让每个人都能够轻松、便捷地享受全球优质的商品和服务,推动商业活动更加高效、可持续,为社会未来的发展带来更多可能性。 我们提供涵盖商品智能、商家服务、供应链优化、跨境物流、搜索推荐引擎、用户增长、金融服务、客户体验、AI 基础设施、企业数智化、全球云及高可用架构、研发效能等技术领域,实习生可跨多个技术域实践,深度参与多场景技术攻坚,探索你想选择的职业发展方向; 在这里,你将和我们一起,采用领先的数字化及人工智能等技术持续解决商业活动中的现实问题,创造技术价值,为消费者带来更加美好的体验!欢迎加入我们! 以下工作内容你均有可能参与: 1、参与基础软件的设计、开发和维护,如分布式文件系统、缓存系统、Key/Value 存储系统、数据库、Linux 操作系统等,探索 AI 在系统调优中的应用(如通过机器学习预测热点数据提升缓存命中率); 2、参与国际电商系统及基础设施的核心模块开发,集成 AI 模型服务,为公司产品提供强有力的后台支持,设计并实施最强大的解决方案; 3、参与产品的开发和维护,完成从需求到设计、开发和上线等整个项目周期内的工作,能够通过 AI 工具提升开发效率; 4、参与海量数据处理和开发,使用Java/SQL/Python开发 ETL 流程,结合大模型实现数据清洗与特征工程自动化(如利用大模型生成 SQL 查询模板); 5、参与项目为用户提供丰富而有价值的桌面或无线软件产品,能够探索 AI 在业务场景的落地应用(如大模型在供应链定价、销量计划、库存、履约等复杂场景的智能洞察和协同,基于大模型的个性化推荐系统,交互式智能导购,需求预测模型部署,异常检测算法实现等)。
负责公司音乐业务相关的算法组件工程化和性能优化相关的算法引擎工作,相关研发技术在抖音、国际化短视频、剪映CapCut、国际化短视频 Music、汽水音乐等产品中应用,满足音乐相关业务场景中的用户不断增长的智能音乐需求,全面提升用户在音乐相关的创作和消费场景的体验。 1、设计和研发业界领先的高性能算法引擎,提供满足音乐识别,音乐理解,大模型自研,大模型应用等场景的核心原子能力; 2、负责深度优化引擎,包括大模型训推加速,向量检索索引优化等常用引擎极致优化; 3、负责算法落地性能评估和分析,制定技术规划和性能标准,持续加强提升关键技术竞争力; 4、相关应用落地,包括音乐识别、音乐理解、对话助手、配乐推荐、音乐电台等。
国际化搜索广告团队不断突破通用搜索引擎变现的界限,覆盖海外应用,致力于构建全球领先的搜索广告变现系统。在国际化搜索广告团队,您将有机会从事大规模分布式存储和架构、自然语言处理、排序和信息检索相关的问题。您还将深入参与我们的广告样式、创意展示和广告投放链路的创新和优化。我们正在寻找勇于挑战困难、热衷于解决复杂问题并与热情洋溢的候选人们共同发展我们的搜索广告产品。 1、参与大规模广告系统的开发; 2、使用机器学习参与广告投放的开发和迭代,参与点击率/转化率模型估计准确性、数据分析、建模、特征工程; 3、参与自然语言处理 (NLP) 能力的提升和查询理解,例如查询分类、seq2seq、实体识别 (NER)、知识图谱、关键词优化等; 4、负责相关性模型和策略优化,例如语义匹配模型、主动学习、文本/照片/视频多模型、排序策略等; 5、 研究和开发广告定向、出价算法、广告流量控制等; 6、 与产品经理和产品战略与运营团队合作,定义产品策略和功能。
团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1)探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2)探索跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3)探索大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4)探索千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务,方方面面都进行深入研究和创新。 1、参与搜索引擎研发,探索搜索全链路(分析、召回、粗排、精排、混排)的个性化行为建模,包括CTR、CVR预估、向量召回、价值混排、RAG、NLP、LLM、多模态、机器学习、深度学习等,推动搜索算法在国际化电商场景的落地与提升,提升亿级用户搜索体验; 2、参与国际化电商搜索算法的优化与迭代,提升转化效率、用户体验和供给生态;解决多语言相关性匹配、权威性感知、种草内容理解、重复铺货、山寨假货治理等技术难题,极致优化内容电商、传统货架电商等多种电商业务形态的基础搜索质量;极致提升商品、种草视频和带货直播的购物转化效率,促进GMV增长; 3、深入参与核心搜索产品的需求设计,负责算法和工程的高质量交付,持续优化效果提升产品体验; 4、挖掘数据,构建Query理解、召回、排序等模型,提升电商搜索算法能力; 5、学习前沿技术,探索大模型等创新技术在AI搜索场景的落地。