拼多多【商业化】搜索、推荐、广告数据开发工程师
任职要求
1、精通数据仓库模型设计与Kimball维度建模方法论,具备丰富的ETL开发及海量数据加工处理经验; 2、具备丰富的Flink实时计算开发与调优经验,精通高并发、高可用、可扩展分布式系统设计原则与实践; 3、具备分布式数据存储与计算平台(Hadoop生态)应用开发经验,熟练掌握HDFS, MapReduce, Hive, HBase等核心技术者优先; 4、具有电商行业经验,优秀的业务理解能力与商业敏感度,能通过数据模型洞察业务问题并驱动目标达成; 5、了解常用机器学习算法及数据建模流程,有搜索/推荐场景应用经验者优先。
工作职责
1、负责电商搜索、广告、推荐等核心业务数据体系及相关工具平台的规划、建设与持续优化,高效支持算法、分析、工程等团队的数据需求; 2、深入理解业务逻辑,抽象业务需求并设计可扩展、高性能的数据技术架构,快速响应业务变化,构建高效、可靠的数据互通与共享机制; 3、负责数据处理链路(离线/实时)的日常运维、监控与保障,确保数据稳定、高效产出,及时解决数据问题。
1、负责拼多多核心电商搜索、推荐、商业化广告场景的模型研发工作,提升用户体验,优化场景的订单、GMV、收入、DAU等指标; 2、负责搜广推全场景的精排CTR、CVR、价格、营销(优惠券、用户增长)等模型的研发,通过优化特征、模型结构、样本Label、数据流等提升模型的效率; 3、负责重排Generator、Evaluator相关的模型研发,通过优化模型结构、List价值定义等提升整体页面的效率; 4、探索大模型在搜广推精排模型的落地,如用户理解、商品理解、创意生成、生成式精排模型等,探索精排模型的Scaling Law,进一步提升模型的效率。
1、负责拼多多核心电商搜索和搜索广告场景(关键词搜索、图片搜索)的个性化流量分发,提升用户体验,优化场景的订单、GMV、收入、DAU、相关性等指标; 2、负责搜索和搜索广告的召回、粗排、精排、重排、相关性、策略方向的优化,提升模型效率、策略的合理性,最大化搜索系统的漏斗效率; 3、研究方向:深度学习、召回模型、LTR、CTCVR模型、Uplift模型、多模态大模型、创意生成和优选、营销增长算法、运筹优化、模型压缩和加速等。追求技术创新和实际业务的结合,深入剖析电商搜索系统的问题,不断提升用户的体验。
1.负责拼多多核心电商搜索、推荐、商业化场景大模型Agent的开发与优化工作,支持业务场景(如AI交互式对话搜索,智能导购,图文创意生成、数字人等)高效落地; 2.负责大模型Agent、RAG系统全流程研发工作,结合业务需要,与算法团队搭档,推进 AIGC 项目在各个场景落地以及效果的持续优化。 3.设计高并发分布式架构,优化检索-生成链路性能,解决高并发环境下的延迟问题,保障服务高性能和SLA。 4.探索大模型在电商推荐、搜索、广告投放等场景的落地,推进技术、产品、数据的闭环协同。