美团NLP算法工程师—AI搜索方向
任职要求
1. 计算机/人工智能相关专业本科及以上学历,1年以上NLP算法研发经验 2. 深入理解Transformer架构,熟悉BERT/GPT等预训练模型技术原理 3. 精通PyTorch框架,具有大模型微调经验,对AI搜索有一定了解 4. 优秀的工程实现能力,能处理亿级数据规模的算法问…
工作职责
1. 主导大模型在搜索链路的全流程应用,包括Query理解、语义召回、结果排序等核心模块的算法优化 2. 研发搜索场景专用的大模型增强技术,涵盖意图识别、任务拆解、文本改写、多轮对话等关键技术方向 3. 探索Prompt Engineering、模型蒸馏、后训练、强化微调等前沿技术在搜索场景的落地实践 4. 构建面向AI搜索的数据挖掘体系,设计模型效果评估与迭代机制 5. 与工程团队协作推进算法模型的高效部署,与产品团队协同推进项目落地等
智能体方向: 1、负责大模型驱动的AI智能体框架的实现,围绕ICL、CoT、记忆机制设计、自进化机制、多智能体协同机制等,优化提升AI智能体效果。 2、负责大模型的微调、强化学习、适配算法、调优工程方案,结合智能体应用,实现最佳效果与性能。 3、参与智能体的评估与优化,支持并构建产品原型和业务落地,支持小布助手、AI搜索等系统级智能体产品的落地。 4、跟踪与研究AI智能体相关前沿技术,并针对大模型推理与规划、工具使用、结构化输出等提出创新性方案。 AI搜索方向: 岗位职责: 1. 负责大模型相关的后训练技术研发,支持 SFT、DPO 和 RL 相关的技术研发,参与 RAG、Agent、用户意图理解等技术的研发; 2. 负责大模型在 OS、小布助手、AI 搜索等场景的应用,支持摘要总结、检索增强、问答、任务规划等领域的落地; 3. 跟进业界前沿技术,持续提升团队在自然语言处理领域的技术积累。
团队介绍:字节跳动抖音搜索团队主要负责抖音搜索算法创新和架构研发工作,主要包括短视频、直播、本地生活、视觉搜索等多个业务线。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、参与字节跳动搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验; 2、参与抖音、今日头条等核心产品的搜索研发工作,服务海量用户; 3、参与搜索核心算法改进,可能的方向包括: 1)NLP:将业界最先进的NLP技术应用到搜索算法改进中,包括纠错、分词、改写、Term Weighting、意图识别; 2)Ranking:解决千亿级网页的排序问题,攻克基础检索、相关性、意图理解、权威性、时效性等世界难题; 3)页面分析和摘要:从千亿网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验; 4)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等; 5)智能问答:探索最先进的阅读理解及语义抽取技术,研发开放域智能问答系统,直接在搜索结果第一位置满足用户Query需求。
【团队介绍】快手电商AI搜索与多模态理解团队,致力于构建文本大模型、视觉大模型、多模态搜索、User Agent新系统,应用于多种电商场景(如快手搜索Query改写/生成/意图识别、搜索相关性、拍照搜同款、图文相似款等)。团队一直坚持学术与业务并向发展的方式,目前在CVPR、WWW、AAAI、EMNLP、SIGIR等会议发表论文多篇 ,并在国内知名赛事与榜单荣获过多项Top2成绩;内部提供充分的交流讨论,现有正式员工与实习同学均来自国内/全球顶尖学校;在这里你会有专业的Mentor实时指导技术创新与业务落地。我们团队的 OneSug、OneSearch、OneSearchV2等相关工作受到业界广泛关注。 1、参与亿级用户规模的电商搜索业务优化,围绕核心业务指标(GMV、购买用户数、点击率、转化率等)开展算法研究与迭代,持续提升用户搜索购物体验,推动电商生态健康发展。 2、深入设计与优化搜索全链路算法模块,包括但不限于:Query理解、召回、粗排、精排、混排、相关性计算、机制策略等;探索并应用序列建模、迁移学习、强化学习、对比学习、多模态大模型等前沿技术,提升模型智能化水平与业务效果。 3、探索前沿的 NLP 技术:LLM驱动的搜索Query理解(Query改写/生成/意图识别)、基础相关性等,全链路拥抱LLM。 4、基于LLM能力,探索新一代的AI搜索前沿场景和技术,包括端到端LLM4Search、LLM4Retrieval等。 5、参与模型蒸馏,量化剪枝,在线实时性部署等工作,支持LLM生成算法的性能优化与落地; 6、针对业务特点,跟踪相关领域的技术发展趋势,进行各类技术方案的探索和学术研究。
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、团队负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式;主要工作方向包括: 1)优化&创新RLHF算法训练效率与模型泛化能力; 2)Long CoT技术的实现和应用; 3)多模态大模型(文本、图像、语音)的Posttraining算法; 4)构建高质量、多领域的数据合成方法; 5)探索LLM在情感对话、创作等场景的应用。