
智能互联淘天集团-数据分析/数据科学专家-用户互动产品
任职要求
1.本科及以上学历,3年以上互联网商业分析、经营分析相关工作经验,计算机,统计学、数学、经济学专业优先;
2.具备良好的SQL和数科分析能力,对AB实验,因果推断熟悉,…工作职责
1. 围绕用户互动产品的场景制定分析框架,建设和迭代指标体系,形成体系化的日常业绩追踪机制,并推进数据监控 看板/数据产品的建设; 2. 负责用户互动侧产品方向重要AB实验的方案设计,过程跟进,以及产出策略优化建议; 3. 负责用户互动侧产品方向的数据分析工作(如淘金币),识别并洞察问题、提出建议、支持业务策略落地; 4. 主动发现问题和业务痛点,独立承接用户互动侧产品相关的研究洞察专题、短中长期可落地的解决方案;
1. 围绕用户互动产品的场景制定分析框架,建设和迭代指标体系,形成体系化的日常业绩追踪机制,并推进数据监控 看板/数据产品的建设; 2. 负责用户互动侧产品方向重要AB实验的方案设计,过程跟进,以及产出策略优化建议; 3. 负责用户互动侧产品方向的数据分析工作(如淘金币),识别并洞察问题、提出建议、支持业务策略落地; 4. 主动发现问题和业务痛点,独立承接用户互动侧产品相关的研究洞察专题、短中长期可落地的解决方案;
如果你渴望投身于AI技术驱动的未来,并希望通过算法与系统研发改变亿级用户的内容体验,那么这里将是你实现梦想的最佳舞台!在淘天集团,我们正在构建一个基于海量图像/视频数据的智能生态,覆盖内容理解、匹配分发、生成等多个核心方向。作为团队的一员,你将参与以下前沿领域的探索与实践: ● AIGC(AI-Generated Content)创新:探索扩散模型(SD、flux系列)、自回归生成(AR)、强化学习、多模态生成技术等前沿方法,打造下一代智能化内容生成工具,赋能电商、娱乐、广告等多个场景。 ● 跨领域联合创新:结合计算机图形学、物理仿真和大语言模型等技术,推动虚拟试穿、3D内容生成、基于文本描述的通用图像编辑、动态视频生成编辑等应用落地,开创视觉技术的新格局。 在这里,你不仅能够接触到行业最顶尖的数据资源,还能与一群聪明、皮实、乐观、自省、追求卓越的伙伴一起,探索未知、突破边界,共同定义视觉技术的未来! 为什么选择我们? ● 海量数据与真实场景:依托淘天集团丰富的业务场景,你将有机会在亿级图像/视频数据上验证你的算法,并看到它们如何直接影响用户的生活。 ● 前沿技术与创新氛围:我们鼓励大胆尝试、快速迭代,支持你在机器学习、深度学习、计算机视觉、AIGC等领域的深入研究。 ● 成长与发展机会:无论你是希望深耕技术成为领域专家,还是逐步转型为技术管理者,我们都会为你量身定制适合的成长计划。 ● 顶级资源支持:无论是计算资源、数据资源,还是与行业顶尖专家的合作机会,我们都将全力支持你的成长。
淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。这一关键角色中,您将参与淘宝搜索功能的核心算法研究,特别是专注于搜索相关性领域。该职位要求深入理解搜索引擎的工作原理,在深度语义相关性模型、大语言模型、多模态技术等方面有突出的贡献。作为团队的核心成员,您将不仅要在您的直接工作领域推动技术突破,还要与其他方向的团队(包括召回、排序、机制等)进行全链路联动,共同推进搜索算法的整体优化。 工作职责: 1. 设计和优化淘宝主搜的搜索相关性算法,包括但不限于文本相关性大模型、多模态相关性大模型、多模态商品理解等等。 2. 通过数据飞轮、知识库建设、数据挖掘、标注任务迭代等持续提高数据质量,积累电商域的知识数据资产。 3. 深入理解电商搜索用户需求, 建立和完善搜索体验分析方法论,以指导模型的迭代和优化。 4. 密切关注并引入最新的LLM、MLLM、NLP和机器学习技术,将其应用于搜索相关性的提升,并在此基础上进行创新。 5. 与召回算法、排序算法、机制等其他团队紧密合作,对搜索算法全链路多阶段漏斗进行研究和分析,并参与搜索框架的设计工作,实现全链路的优化和协同。 6. 拓展和指导团队的技术视野,提出并推动解决搜索相关性的新思路和方法。
团队背景:淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。 工作职责 1. 和淘宝电商搜索业务紧密结合,设计和改进机器学习模型的架构,实现高效的搜索大型模型训练和推理系统(特别是大规模语言模型,GPT、LLaMA、通义千问等),确保其高效性和准确性,以提高计算性能和加速模型收敛 2. 负责百亿参数以上超大模型的推理训练与性能优化:进行搜索在线模型的性能分析和调优,识别和解决瓶颈问题,提高模型的训练和推理速度,以适应并充分利用硬件资源,确保在高效计算资源利用的前提下,提供快速响应的搜索业务体验 3. 应用不限于剪枝、量化、知识蒸馏,各种并行策略(DP/TP/PP/EP等)等技术来优化模型的复杂度和运行速度,同时探索模型在样本、训练、存储和推理的极致性能 4. 在大模型的Token压缩方面进行性能探索,包含入图前的超长token压缩甚至长token直接入图等性能优化,以满足大模型结合超长token在海量数据以及极致在线性能的应用 5. 和工程团队协同,依据训练推理机器资源水位以及优化空间,简化和加速模型训练和推理的部署过程,实现离线在线资源的高性价比利用。 6. 参与设计和优化淘宝整体搜索系统,包括多阶段漏斗设计和整体链路设计,确保系统的稳定性和高效性