logo of quark

夸克算法工程师-多模态大模型

校招全职智能信息秋季2026届应届生招聘地点:北京 | 杭州 | 上海状态:招聘

任职要求


1. 计算机视觉自然语言处理、语音、机器学习、跨模态表征学习等相关专业的硕士生/博士生,有扎实的研发经验;
2. 熟练掌握pytorchtensorflow等至少一种主流深度学习框架-能够独立实现前沿模型,有NLP/CV/ML顶会发表经验者。熟悉deepspeed/megatron/FSDP大模型基础训练算法,对自回归模型和扩散模型等技术有深刻理解与认知,熟悉LLaMa、Qwen、FLUX和SD等开源模型,有大规模模型训练工程经验者优先。
3. 熟悉多模态大模型相关技术和应用场景,有相关项目经验者优先;
4. 良好的学术调研能力,良好的逻辑和数据分析能力,有高质量论文、开源项目、ACM竞赛经历、相关学术会议组织的权威比赛获奖经历或落地项目产出者优先。 
【加分项】
1. 在高影响力的开源项目中,做出过核心贡献;
2. 在国际竟赛(如:ACM ICPC,Kaggle,KDD Cup,SemEval等)中获得过优异成绩。

工作职责


1.从事多模态生成/理解大模型的研究与开发,包括但不局限多模态生成预训练、多模态理解、多模态数据处理、多模态后训练、多模态强化学习等跨模态算法的研发和优化,跟进并保持业界技术领先;
2.推进跨模态内容理解/生成前沿技术的创新落地。设计和优化现有算法,提高性能和准确性,确保高质量的用户体验;
3.关注多模态/NLP/CV等方向的前沿技术,及时将新技术应用到产品中。
包括英文材料
OpenCV+
NLP+
机器学习+
PyTorch+
TensorFlow+
深度学习+
DeepSpeed+
Megatron+
FSDP+
大模型+
算法+
Llama+
数据分析+
Kaggle+
相关职位

logo of amap
实习高德地图2026

我们正在寻找对多模态技术充满热情的算法工程师,加入我们的前沿技术研发团队。您将专注于多模态理解与生成,推动其在地图数据、信息流推荐、打车服务等场景中的落地应用,为用户提供更智能、更沉浸的服务。 主要职责 1、多模态模型研发:开发业界领先的图文多模态理解与生成模型,结合扩散模型(Diffusion Models)、Transformer架构等实现高质量场景理解和动态内容生成。 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等)。 3、业务场景落地:将多模态技术应用于实际业务场景,如地图数据(道路、POI等)、信息流推荐、打车服务等。与产品、工程团队合作,推动技术从研发到上线的全流程落地。 4、前沿技术探索:持续跟踪生成式AI(Generative AI)、跨模态对齐、思维链强化学习、多模态交互、具身智能等最新技术趋势,提出创新性解决方案。

更新于 2025-05-29
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 1.负责原生多模态统一大模型的数据构建、模型结构和训练策略设计等工作,包括统一编码器和网络结构设计,合成数据策略,以及跨模态融合训练策略等。 2.通过方案的优化设计帮助模型有持续scale up能力,助力模型在多模态理解和生成任务上实现sota。 3.通过后训练强化学习提升多模态对齐、多模态推理思考能力,激发模型在下游跨语音、视觉等应用场景中的潜力。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-06-09
logo of alibaba
实习淘天集团T-St

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 1.负责原生多模态统一大模型的数据构建、模型结构和训练策略设计等工作,包括统一编码器和网络结构设计,合成数据策略,以及跨模态融合训练策略等。 2.通过方案的优化设计帮助模型有持续scale up能力,助力模型在多模态理解和生成任务上实现sota。 3.通过后训练强化学习提升多模态对齐、多模态推理思考能力,激发模型在下游跨语音、视觉等应用场景中的潜力。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-08-13
logo of lilith
社招3年以上技术

负责研发基于多模态大模型的智能化解决方案,推动AI技术在游戏产品中的落地应用。 1. 多模态AI Agent开发:设计和实现基于视觉-语言模型的智能Agent系统,支持游戏场景的自动化分析与交互 2. 模型优化与部署:对多模态大模型进行微调、量化和工程优化,确保在生产环境中的高效运行 3. 视觉算法研发:开发游戏场景中的目标检测、图像分割、OCR等视觉算法模块 4. 技术创新:跟踪前沿AI技术,探索LLM、AIGC等技术在游戏领域的创新应用

更新于 2025-06-19