高德地图算法实习生(大模型与推荐方向)
任职要求
职位要求(Job Requirements): 学历背景: 计算机、人工智能、数学、电子信息、自动化等相关专业,硕士及以上学历在读(2025/2026年及以后毕业),能够保证连续实习 3 个月以上,每周出勤 4 天以上者优先。 编程基础: 具备扎实的编程功底,熟练掌握 Python,了解 C++ 或 Java;熟悉数据结构与算法,代码风格良好。 框架技能: 至少熟悉一种主流深度学习框架(PyTorch / TensorFlow),有实际的模型训练和调试经验。 领域知识(满足其一即可): 熟悉 NLP 领域,了解 Transformer 架构,有 LLM 微调(LoRA/P-tuning)或 RAG 实践经验者优先。 熟悉推荐系统基本流程(召回/排序),了解 D…
工作职责
职位描述(Job Description): 你将加入高德地图核心算法团队,在资深算法专家的指导下,探索大模型(LLM/多模态)与推荐系统的深度结合。你将有机会接触亿级用户规模的真实业务场景,参与从前沿技术研究到工程落地的全过程。 你将参与或负责以下工作内容(包括但不限于): 大模型前沿探索: 参与 Qwen-VL、InternVL 等多模态大模型及 LLM 在高德业务场景下的微调(SFT)、对齐(RLHF)及 Prompt 优化,探索生成式推荐的新范式。 推荐算法优化: 深入理解高德核心业务(如首页推荐、目的地预测),协助优化召回、排序(粗排/精排)、重排等核心模块,提升 CTR、CVR 等关键业务指标。 用户行为建模: 利用深度学习技术挖掘用户长短期兴趣,结合高德特有的时空数据,进行下一站预测和场景化意图推理。 多模态内容理解: 处理海量图像与文本数据,构建高质量的内容表征体系,解决冷启动问题,提升内容分发效率。 数据分析与实验: 深入分析业务数据,设计并跟进 AB 实验,通过数据驱动的方式验证算法效果并进行迭代。 你将获得: 核心业务场景: 接触高德亿级日活用户的真实数据,解决极具挑战性的时空推荐问题。 大牛导师带教: 资深算法专家一对一指导,提供清晰的成长路径和技术辅导。 前沿技术落地: 拥有充足的算力资源(GPU集群),亲手将大模型技术落地到实际产品中。 转正机会: 表现优异者可获得校招转正 Offer 或 绿色通道面试资格。
职位描述 你将加入高德地图核心算法团队,在算法专家的指导下探索大模型(LLM/多模态)与推荐系统的深度结合。你将有机会接触亿级用户规模的真实业务场景,参与从前沿技术研究到工程落地的全过程。 你将参与或负责以下工作内容(包括但不限于): 1.用户兴趣预测:基于生成式大模型解析用户行为与商品/内容语义,构建⽤户需求预测模型,提升推荐场景的转化与⽤户体验; 2.端到端⽣成式链路:探索端到端生成式范式,替代传统多阶段漏斗链路流程,基于强化学习融合业务逻辑,建设出具备⾼效scaling能力的生成式算法新链路; 3.重排范式创新:借鉴生成式大模型技术构建生成式重排创新范式,通过Reward model + 强化学习实现端到端序列整体生态价值建模; 4.深入研究和理解大模型预训练、微调与强化学习技术,结合搜推业务目标持续优化模型效果。
【职位前言】 DeepSeek-R1的发布给世界带来了不小的震撼,更令人敬佩的是,无论是赶超OpenAI o1的模型效果,还是节省百万美元成本的工程优化,这背后的原理与实现都在官方发布的技术报告和开源项目中一一公开。 大语言模型的前沿研究将不再只是少数巨头才玩得起的项目,更多的研究者可以入局这场对人工智能探索的新征程。 如果您对模型背后的工程优化充满好奇(FP8混合精度训练、分布式专家并行等),想深入了解并上手实践,但又没有合适的计算资源与明确的优化目标,又对模型 post-training(GRPO强化学习、模型蒸馏等等)跃跃欲试,但又没有明确的应用场景和数据资源—— 那不妨来网易云音乐,和我们搭上这趟时代的列车,一起拆解硬核技术,聚焦于音乐业务中的搜索、推荐、广告场景,探索大模型的应用落地与高效部署。 【职位描述】 1、参与大模型在后训练和推理工程中的性能优化,结合底层硬件特性从混合精度训练、矩阵计算加速、注意力机制计算优化、GPU分布式并行等方面提升工程效率; 2、通过强化学习、模型蒸馏等方式,构建音乐领域具有 CoT 推理能力的大语言模型,应用于搜索、推荐、广告等业务场景。 【我们拥有】 1、音乐行业内海量用户独一无二的数据资源; 2、贴近实际的业务场景,让 idea 落地并发挥价值; 3、可观的计算资源,性能上还有极大的空间待与你一同挖掘; 4、鼓励创新探索、倡导悉心钻研、宽松融洽多元的团队氛围; 5、成果转换的支持,合作完成项目及论文,助力未来的职业发展。
本课题研究如何优化向量检索技术以增强大型语言模型能力。 主要方向包括: 1、优化高维向量索引结构,实现千亿级多模态数据的高效检索; 2、设计多Agent场景下的智能检索增强生成(Agentic RAG)策略,探索检索结果与大模型上下文的最优融合方法; 3、研究基于向量检索优化大模型推理过程中的KV Cache机制,为智能体应用的效果优化和大模型推理提供关键技术支持。