饿了么饿了么-知识图谱/搜索推荐算法专家-AI应用算法
任职要求
1. 基础NLP方面,有5年以上实际研究或项目经验;或者,在大模型方面,有3年以上的研究或项目经验。总体工作年限在5年以上; 2. 良好的编程能力,熟练使用至少一种常用编程语言,如Python、Java、C++; 3. 过往有研究成果加分; 4. 过往有带人经历,带小组、项目,且依然具备一线研发能力,加分; 5. 有知识图谱经历、搜索经历、饿了么到店/到家外卖等工作经历者,加分。
工作职责
1. 知识图谱。主导、参与、设计知识图谱,包括底层本地层设计、实体挖掘、关系抽取、知识推理等。结合零售、医药等领域,并结合搜索词、场景词,构建更为完整的意图图谱体系。图谱建构既需要考虑行业的多样性,也需兼顾行业实体的属性、关系深度,最终目标是构建并长期迭代一个高覆盖、高质量的知识图谱; 2. 意图理解。基本NLP的工作,以NLU为主。其中,搜索关键词理解是主要场景,并有SUG、融合搜、主搜索链路等落地场景。具体NLP任务有且不限于,对于词的基本理解、分类、纠错改写同义归一等; 3.参与建设了么搜索场景的Query供给、召回、排序模块的算法优化,包括候选质量控制、出词相关性计算、以及CTR、CVR、GMV等预估模型的开发; 4.大规模预训练LLM。建设饿了么垂域场景下的语言大模型/多模态大模型,基于通用底座,进行retrain or fine-tune;需要对模型训练底层的算力、框架比较熟悉;构建样本、设计训练任务,并持续调优;上层支撑对应的任务和业务场景,拿收益。
商品基础算法团队是淘天集团核心的商品理解中台,负责对淘天全域(淘宝、天猫等)数百亿的商品进行深度、精准、多维度的内容理解。我们产出的商品认知能力(如属性、卖点、风格、品类、知识),是整个淘天搜索、推荐、广告、AIGC应用、智能导购、直播等所有核心业务的基石,直接决定了用户“逛”和“买”的体验,是连接“人”与“货”的智能引擎。 当前,我们正处在用新一代AI技术(大模型、多模态大模型)彻底重塑商品世界的历史机遇期。在这里,你将接触到全球最丰富、最复杂的电商多模态数据,有机会定义下一代商品理解的技术范式,你的工作成果将通过集团各大业务场景,影响亿万用户的消费决策。 岗位职责: 1. 构建业界领先的商品多模态理解体系: 负责利用大语言模型(LLM)及视觉语言模型(VLM)等前沿技术,对商品的多模态内容(文本标题、详情描述、图片、视频等)进行深度解析,完成高质量的标签抽取、卖点挖掘、风格识别、需求理解等核心任务。 2. 探索大模型背景下的下一代商品知识库的构建范式:如何从海量商品信息、用户评论、行业知识中自动化构建知识体系?如何解决知识的事实性问题?如何在庞大、有噪声的知识库中抽取有效知识,用于下游落地和应用 3. 负责大模型/多模态模型的前沿技术探索与落地: 跟踪并实践领域内前沿的模型和技术(如模型Fine-tuning, RAG, In-Context Learning, Agent, Model Distillation等),结合业务场景进行技术选型、方案设计与模型优化,解决从训练到部署全链路的挑战,实现技术创新与业务效果的双赢。 4. 设计和优化算法架构与系统: 负责商品理解算法系统的整体架构设计与持续迭代,保证系统的高性能、高可用和高扩展性,以应对淘天集团海量数据的挑战。 5. 驱动技术创新转化为业务价值: 深入理解业务,主动挖掘技术能创造价值的场景,与产品、工程团队紧密协作,通过严谨的AB实验验证算法效果,用技术力量持续驱动业务指标增长。
需要有base海外工作经验,外籍也可考虑 岗位招募方向(搜推/风控/nlp/CV/AI大模型相关等): (1)搜推算法 1、负责从0到1搭建搜索/推荐排序项目及后续持续迭代优化,进行线下和线上实验评估,并对于算法策略进行持续优化; 2、深入理解包括搜索、推荐等流量分发场景的业务模式,通过数据分析和挖掘,构建产品侧和用户侧等特征,驱动搜索排序算法迭代; 3、在电商场景有人货场匹配的应用经验,针对AB实验进行效果分析和归因分析,并不断从业务角度、数据角度推进搜索排序模型优化; 4、主动诊断及发现业务问题,科学的方法和分析输出业务策略,同时能基于复杂的业务问题进行数据挖掘和模型探索,沉淀业务分析思路,产出对业务和产品有价值的方案和建议。
1. 参与面向亿级用户和千万级流量的广告平台/广告引擎的系统架构、核心功能开发、工程优化与稳定性保障; 2. 推动AI在广告系统中的深度应用,包括个性化投放、智能创意生成(AIGC)、内容审核与推荐等模块的工程实现和性能提升; 3. 主导高可靠、高精度的广告计费/结算子系统研发,确保交易链路的准确性、数据一致性与高并发处理能力; 4. 设计并持续优化广告流量反作弊、异常监测与风控体系,支持实时攻击防御与灰产行为识别,提升平台安全水平; 5. 联合算法团队推动广告CTR/CVR预估、用户行为建模、内容理解等模型上线、服务化部署及效果监控; 6. 构建高效稳定的广告数据流和特征管理系统,支持线上实时计算、批量数据处理、特征提取与回流; 7. 建设完备的系统监控、告警、日志、安全与自动化测试等工程支持体系,保障广告系统全链路高可用与可观测性; 8. 关注业界前沿技术和最佳实践,将创新方案转化为商业价值,积极参与跨团队协作推动项目落地。
1. 参与面向亿级用户和千万级流量的广告平台/广告引擎的系统架构、核心功能开发、工程优化与稳定性保障; 2. 推动AI在广告系统中的深度应用,包括个性化投放、智能创意生成(AIGC)、内容审核与推荐等模块的工程实现和性能提升; 3. 主导高可靠、高精度的广告计费/结算子系统研发,确保交易链路的准确性、数据一致性与高并发处理能力; 4. 设计并持续优化广告流量反作弊、异常监测与风控体系,支持实时攻击防御与灰产行为识别,提升平台安全水平; 5. 联合算法团队推动广告CTR/CVR预估、用户行为建模、内容理解等模型上线、服务化部署及效果监控; 6. 构建高效稳定的广告数据流和特征管理系统,支持线上实时计算、批量数据处理、特征提取与回流; 7. 建设完备的系统监控、告警、日志、安全与自动化测试等工程支持体系,保障广告系统全链路高可用与可观测性; 8. 关注业界前沿技术和最佳实践,将创新方案转化为商业价值,积极参与跨团队协作推动项目落地。