logo of amap

高德地图高德-AIGC多模态生成&理解算法工程师/专家-北京

社招全职3年以上技术类-算法地点:北京状态:招聘

任职要求


1.计算机、数学相关的硕士/博士毕业生;
2.在多模态大模型、AIGC、图像生成、视频生成、视频理解、3D生成等领域有一定的经验,能够掌握领域内的最新技术进展,具备实现、改进新的算法能力;
3.熟悉MLLM模型、diffusion、auto-regress…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:
高德地图机器学习研发部是公司AI核心技术引擎,聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地,支撑亿级用户产品,同时长期投入前沿探索,在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文,多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源,鼓励创新突破,诚邀你与顶尖算法专家并肩,共同定义AI的未来!如果你渴望挑战多模态与生成式AI的技术巅峰,在视频、图像、大模型的交叉领域实现突破,欢迎加入我们!团队的github页面是:https://github.com/AMAP-ML/

我们提供
• 参与亿级用户产品的AI核心算法研发,见证技术直接赋能业务;
• 与学术大牛和工业界专家共事,持续提升技术视野;
• 顶配算力资源+开放创新氛围,支持前沿探索与顶会论文发表。

具体职责包括但不限于:
1. 视频生成:负责视频生成技术的前沿技术的研究,对AIGC的diffusion和auto-regressive技术有深入了解,在T2I/AIGCT2V/I2V上面有一定的研究,图文对齐,长视频生成等有一定的研究,做好视频生成在高德业务(广告,POI详情页等)中的进行落地。
2. 视频理解:能够使用和优化多模态大模型对用户上传的视频进行质量理解,标签,densecaption,视频summary等生成,作用到视频的搜索,广告,推荐等业务的落地。
3. 世界模型: 参与世界模型的构建,能够使用最新的视频生成技术,3D技术等构建符合人类物理规律的统一的世界模型,在高德的业务进行落地。
4. 紧跟技术前沿和技术沉淀,形成顶会论文和专利。
包括英文材料
算法+
深度学习+
TensorFlow+
PyTorch+
CVPR+
ICCV+
还有更多 •••
相关职位

logo of kuaishou
实习D0001

1、参与多模态生成算法的调研和分析,如Diffusion Models 、 GAN 、 VAE 、 Autoregressive Models等,包括但不限文本/图像/视频生成,解决生成质量、多样性、可控性、采样效率、可编辑等问题; 2、参与多模态生成算法的基础模块的研发,如 VAE、CLIP、LLM 等; 3、协助多模态生成算法的效果分析、数据优化、行业调研 等。

更新于 2025-02-12北京
logo of 37wan
社招2年以上

负责三七互娱-37手游 AIGC应用开发与服务化工作,推动多模态生成能力在公司实际业务中的高效落地。持续参与视频生成、图片生成、音乐生成、AI Agent等前沿技术在企业内外的实践与规模化应用。包括且不限于: 1. AIGC平台系统开发:保障企业级模型服务的稳定性、安全性和可扩展性,包括但不限于模型/服务自动化部署、运行监控、弹性扩缩容、自动回滚、故障自愈、全链路可观测性和 SLA 管理等。 2. AIGC多模态应用工作流的设计与开发:负责企业级多模态大模型工作流的设计与开发,包括流程自动化、工具链集成以及低/无代码应用平台的建设,助力业务智能化升级。 3. LLM 工作流编排与Multi-agent系统的设计与开发:构建Multi-agent协作系统,实现 agent自治、分布式任务调度、任务拆解与动态规划等能力,支持复杂业务场景的自动化与智能决策。

广州
logo of quark
实习日常实习生

1. 主导或参与图像/视频生成大模型的核心算法研发,聚焦扩散模型及VAE的前沿架构创新优化,完成大规模分布式训练、数据流水线构建及算法工程化部署; 2. 推动视觉生成技术在夸克多产品线的场景化落地,解决实际工程问题,实现从算法原型到工业级系统的端到端优化; 3. 开展前沿算法研究,探索多模态后训练、可控生成及推理加速等方向,保持算法的领先性。

更新于 2026-01-12杭州|上海
logo of eleme
社招3年以上技术类-开发

1、驾驭亿级规模核心系统:负责本地零售亿级商品库的顶层架构设计与演进,主导 SPU/CSPU 等基础模型建设,支撑高并发下的搜索、选品及多渠道分发,打造行业领先的商品数据底座。 2、引领前沿的 AI 大模型落地:深度参与AIGC 在商品全生命周期的变革,利用多模态大模型重塑智能发品、自动归类、内容生成及质量质检流程,推动业务从“人工运营”向"智能自治"跃迁。 3、构建数据与智能闭环:携手算法与产品团队,建立“数据 - 模型 - 业务”的高效反馈闭环。通过RAG 知识库、批量推理及自动化实验等前沿技术,持续优化商品数据的准确性与转化效率,赋能零售搜索与智能决策。 4、探索研发新范式与极致性能:在保障系统高可用与极致稳定性的同时,率先探索 Vibe Coding、AI Agent 等新范式在研发流中的落地,提升团队整体效能,解决海量数据下的复杂工程挑战。

更新于 2026-03-27上海