百度机器学习/数据挖掘/自然语言处理工程师(J78404)
任职要求
-热爱互联网,对技术研究和应用抱有浓厚的兴趣,有强烈的上进心和求知欲,善于学习和运用新知识 -具有一个或多个领域的理论背景和实践经验:机器学习/数据挖掘/深度学习/信息检索/自然语言处理/机制设计/博弈论 -至少精通一门编程语言,熟悉网络编程、多线程、分布式编程技术,对数据结构和算法设计有较为深刻的理解 -良好的逻辑思维能力,对数据敏感,能够发现关键数据、抓住核心问题 -较强的沟通能力和逻辑表达能力,具备良好的团队合作精神和主动沟通意识 -深入理解机器学习常用组件(CNN/RNN/Transformer/BERT/ERNIE/LLM等)的原理,有1年以上机器学习相关项目或研究经验优先 熟练掌握常用数据结构及算法,熟悉JAVA/C++/GO等语言编程,有一定编程经验优先 -熟练使用至少一门脚本语言,如python,linux shell,熟悉linux操作系统,能胜任在linux操作系统上工作优先 -熟练使用SQL语言进行常用的数据查询、分析操作优先 -有强烈的责任心和团队配合意识及能力,并有较强的解决问题能力优先 -熟悉海量数据处理、最优化算法、分布式计算或高性能并行计算,有相关项目经验优先
工作职责
-研究数据挖掘或统计学习领域的前沿技术,并用于实际问题的解决和优化 -大规模机器学习算法研究及并行化实现,为各种大规模机器学习应用研发核心技术 -通过对数据的敏锐洞察,深入挖掘产品潜在价值和需求,进而提供更有价值的产品和服务,通过技术创新推动产品成长 -负责对搜索、商业广告、运营活动、电商交易等场景风控策略及模型进行迭代、研究与探索,建设业内领先的反作弊、风控算法系统
-团队描述 商业品牌策略研发组,隶属于百度移动生态事业群,致力于构建业界领先的品牌广告搜索引擎,负责包括开屏矩阵、品牌专区、信息流GD、品牌智能体等多个公司核心业务线,服务包括零售、美妆、服饰、汽车、3C等行业知名品牌客户。基于百度搜索、信息流亿级别的用户流量,设计实现大规模、高吞吐、低延时的分布式广告检索系统,处理在线、离线、近线等多种复杂业务场景;依托于海量的互联网数据,在触发排序策略、相关性模型、转化优化、流量预估、库存分配等方向,都有雄厚的积累和技术领先性;基于vue、react等业界主流前端框架,打造一站式的品牌样式生产平台,为品牌客户制作丰富、优质、炫酷的广告创意,给予百度用户优秀的视觉和交互体验;良好的团队技术氛围,定期的前沿技术分享与业务探讨,每一位同学在这里都能获得技术深度和业务广度的积累和成长 -研究数据挖掘或统计学习领域的前沿技术,并用于实际问题的解决和优化 -大规模机器学习算法研究及并行化实现,为各种大规模机器学习应用研发核心技术 -通过对数据的敏锐洞察,深入挖掘产品潜在价值和需求,进而提供更有价值的产品和服务,通过技术创新推动产品成长
1.迭代召回及相关性算法能力,深入理解用户意图、挖掘广告内容信息,提升广告匹配效率 2.优化点击率、转化率模型效果,利用丰富的内容和用户行为数据,并结合实际业务场景,提升模型预估准确度 3.优化广告策略算法建设,深入理解广告机制,在智能出价、拍卖机制等方向上迭代策略,提升广告主投放体验 4.跟踪学习相关领域前沿进展,探索新技术在实际业务场景中的落地
1. 迭代召回模型,提升个性化能力 2. 迭代相关性模型/Query意图模型,深入理解用户意图,平衡相关性和效率 3. 优化视频内容的多模态模型,深入理解视频内容信息,服务全链路算法模块 4. 优化点击率、各类转化率、时长模型效果,提升模型的个性化能力,优化准度 5. 优化全链路排序策略,更好的平衡多目标,提升搜索结果页质量以及长期目标,如搜索渗透和留存