阿里巴巴业务技术线-推荐架构工程师-大数据方向
任职要求
1. 熟练掌握Spark、Flink、Kafka等大数据批流应用开发,熟悉原理与性能调优; 2. 熟练掌握Java基础,熟悉IO、多线程、缓存、消息、数据库等分布式中间件; 3. 熟悉Hive、HDFS、HBase、ClicHouse、Hu…
工作职责
团队负责淘宝首页、信息流的业务研发、推荐工程。本次招聘大数据方向 1. 为大规模推荐业务,设计并实现合理、高性能、可扩展的实时数据系统; 2. 深入推荐系统链路,通过实时、丰富、可靠的数据服务,提升系统性能和推荐效果; 3. 理解流量机制策略,建设实时、有序、高效的流量策略平台,提升不同策略的落地和实验效率。
团队介绍:字节跳动抖音搜索团队主要负责抖音搜索算法创新和架构研发工作,主要包括短视频、直播、本地生活、视觉搜索等多个业务线。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、参与抖音,今日头条,西瓜视频,剪映等App,以及国内电商,生活服务等重点业务的搜索推荐模型和策略改进,负责这些业务的搜索流量和用户渗透增长&搜索心智建设任务; 2、以推荐算法为核心技术栈,改进基于超大规模机器学习模型的推荐系统,覆盖从候选挖掘到召回,粗排,精排,多目标融合全链路技术环节; 3、探索短文本推荐和通用推荐技术的上限,重点是推荐和NLP技术的联合应用,以及多模态等前沿技术的探索。
1.主导多模态推荐系统研发,结合文本、图像、视频等多模态数据优化商品理解、用户行为分析及推荐策略,推动多模态与电商场景的深度融合。 2.设计并实现跨模态对齐技术(如图文/视频语义一致性建模),提升推荐系统的泛化能力和冷启动效果,探索多模态大模型在电商中的创新应用(如CLIP、BEiT3等框架优化)。 3.推动多模态模型的工程化部署,包括分布式训练加速(如TensorRT-LLM)、推理效率优化及性能调优。 4.结合搜索与推荐场景,探索多模态特征在排序、检索中的辅助作用,提升用户交互体验。
Part 1,后端开发: 1、负责数据产品后端的设计与实现,确保系统具备良好的架构设计、扩展性及高可用性; 2、根据系统设计,完成平台的开发、测试和线上维护工作,保障系统的稳定运行; 3、负责系统的服务端调优,持续提升系统性能和服务质量,并编写设计、开发、测试等相关文档,为团队提供清晰的技术指导。 Part 2,AI应用探索与开发: 1、参与AI技术在数据产品中的应用探索,包括但不限于自然语言处理、机器学习、深度学习等方向; 2、负责AI应用的后端开发工作,实现AI模型与现有数据产品的无缝对接; 3、与数科、算法紧密合作,将AI技术转化为实际的产品功能,提升数据产品的智能化水平; 4、跟踪AI领域的最新技术动态,结合业务需求,推动AI技术在数据产品中的创新应用。