高德地图高德-算法专家(LLM内容理解)-信息研发
任职要求
1. 计算机科学、人工智能、机器学习或相关领域的硕士或博士学位。 2. 至少3年在内容理解(如GPT Bert CLIP等)优化方面的工作经验。 3. 精通Python编程以及TensorFlow、PyTorch等深度学习框架。 4. 有大规模深度模型训练或LLM业务应用经验的同学优先。 5. 对最新的机器学习技术和趋势有深入了解。 6. 良好的团队合作能力和出色的解决问题能力。 7. 优秀的沟通技巧和流利的英语水平。
工作职责
1. 设计和实现多模态(图文)和多源信息(PGC/UGC/Web content等)的综合内容理解,以优化我们的地图搜索、推荐和POI信息理解能力。 2. 深入研究和改进模型的性能,包括准确性、效率和可扩展性。 3. 与跨职能团队合作,包括数据工程师、产品经理和架构工程师,确保模型与业务目标一致。 4. 跟踪新的人工智能和机器学习研究,将新的研究成果应用于实际问题。 5. 负责模型的维护和迭代,确保其在动态环境中的稳定性和可靠性。
在LLM重构搜索的浪潮中,数据质量决定模型智能的天花板。我们需要你构建数据与模型的「双向进化引擎」,从万亿级多模态数据中提炼认知黄金,驱动大模型突破搜索理解的终极边界! 1. 万亿级网页提炼:研发多模态数据分析框架,通过网页解析、文档智能、知识抽取等技术,完成全网万亿级搜索网页的关键信息提炼。 2. 攻克数据质量理解:设计网页质量/权威性/可信度的多维度评估模型,以及跨模态数据表征技术,提升夸克在网页知识获取的准确性与可靠性。 3. 驱动数据与算法协同进化:探索大模型时代的数据评估方法论,量化数据优化对搜索效果和模型性能的影响。 4. 打造全网优质内容库:构建多模态数据的处理和挑选管线,建立覆盖网页/图文/视频等全域内容的智能知识库。
围绕高德的核心业务场景,研究大模型与推荐结合提升业务效果并落地,不限于LLM、多模态大模型SFT、RLHF、多模态理解、内容表征、推荐算法、行为序列建模、搜索算法。
1、商业化LLM:负责大语言模型(LLM)的前沿技术探索和全链路研发,包括但不限于抗知识遗忘的继续预训练、指令微调、RLHF等,结合广告业务场景,研发基于大语言模型下游应用,包括但不限于营销场景下的语义理解、信息抽取、脚本生成、对话系统等,提升广告投放系统的智能化能力; 2、广告AIGC:负责以扩散模型等为代表的前沿图文/短视频的生成式AI在内容创作方面的算法研发和落地,包括但不限于text to image, text to video, image and video editting等,结合文本/图像/视频/音频等多模态匹配技术、广告投放优化策略和模型,优化AIGC系统生成效果和广告投放效果; 3、多模态大模型for推荐:负责视频多模态大模型的最新研究进展和相关技术实现(视频理解、视频内容问答、视频caption等),提出并优化最前沿算法,将多模态等基础大模型的表征学习与广告业务相结合,提升广告分发效率。