logo of amap

高德地图算法工程师-多模态大模型

实习兼职高德地图2026届春季校园招聘地点:北京状态:招聘

任职要求


1、计算机科学、人工智能等相关专业硕士及以上学历。
2、熟悉多模态领域前沿技术(如CLIP、Stable Diffusion、DreamFusion等),掌握指令微调、LoRA等高效微调方法。有实际项目经验的优先。
3、熟练使用PyTorchTensorFlow等框架,具备扎实的PythonC++编程能力。
4、在顶级会议(如CVPRICCV、SIGGRAPH、NeurIPS)发表过相关论文者优先。
5.   具备较强的学习能力,能够快速掌握新技术,对新技术充满好奇心,具备高度的自驱力和韧性。

工作职责


我们正在寻找对多模态技术充满热情的算法工程师,加入我们的前沿技术研发团队。您将专注于多模态理解与生成,推动其在地图数据、信息流推荐、打车服务等场景中的落地应用,为用户提供更智能、更沉浸的服务。


主要职责
1、多模态模型研发:开发业界领先的图文多模态理解与生成模型,结合扩散模型(Diffusion Models)、Transformer架构等实现高质量场景理解和动态内容生成。
2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等)。
3、业务场景落地:将多模态技术应用于实际业务场景,如地图数据(道路、POI等)、信息流推荐、打车服务等。与产品、工程团队合作,推动技术从研发到上线的全流程落地。
4、前沿技术探索:持续跟踪生成式AI(Generative AI)、跨模态对齐、思维链强化学习、多模态交互、具身智能等最新技术趋势,提出创新性解决方案。
包括英文材料
学历+
PyTorch+
TensorFlow+
Python+
C+++
CVPR+
ICCV+
NeurIPS+
Stable Diffusion+
相关职位

logo of quark
校招智能信息秋季20

1.从事多模态生成/理解大模型的研究与开发,包括但不局限多模态生成预训练、多模态理解、多模态数据处理、多模态后训练、多模态强化学习等跨模态算法的研发和优化,跟进并保持业界技术领先; 2.推进跨模态内容理解/生成前沿技术的创新落地。设计和优化现有算法,提高性能和准确性,确保高质量的用户体验; 3.关注多模态/NLP/CV等方向的前沿技术,及时将新技术应用到产品中。

更新于 2025-08-13
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 1.负责原生多模态统一大模型的数据构建、模型结构和训练策略设计等工作,包括统一编码器和网络结构设计,合成数据策略,以及跨模态融合训练策略等。 2.通过方案的优化设计帮助模型有持续scale up能力,助力模型在多模态理解和生成任务上实现sota。 3.通过后训练强化学习提升多模态对齐、多模态推理思考能力,激发模型在下游跨语音、视觉等应用场景中的潜力。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-06-09
logo of alibaba
实习淘天集团T-St

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 1.负责原生多模态统一大模型的数据构建、模型结构和训练策略设计等工作,包括统一编码器和网络结构设计,合成数据策略,以及跨模态融合训练策略等。 2.通过方案的优化设计帮助模型有持续scale up能力,助力模型在多模态理解和生成任务上实现sota。 3.通过后训练强化学习提升多模态对齐、多模态推理思考能力,激发模型在下游跨语音、视觉等应用场景中的潜力。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-08-13
logo of lilith
社招3年以上技术

负责研发基于多模态大模型的智能化解决方案,推动AI技术在游戏产品中的落地应用。 1. 多模态AI Agent开发:设计和实现基于视觉-语言模型的智能Agent系统,支持游戏场景的自动化分析与交互 2. 模型优化与部署:对多模态大模型进行微调、量化和工程优化,确保在生产环境中的高效运行 3. 视觉算法研发:开发游戏场景中的目标检测、图像分割、OCR等视觉算法模块 4. 技术创新:跟踪前沿AI技术,探索LLM、AIGC等技术在游戏领域的创新应用

更新于 2025-06-19