logo of quark

夸克算法实习生-多模态生成方向

实习兼职日常实习生地点:杭州 | 上海状态:招聘

任职要求


1、计算机科学、人工智能、机器学习或相关专业,硕士及以上学历优先;具备扎实的数理基础(线性代数、概率统计、最优化理论)及算法设计能力;
2、精通Python等编程语言,熟悉Linux开发环境,有良好编程习惯和较…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与图像和视频生成相关Agent的核心算法架构设计、开发与性能优化,完成模型训练、数据流水线构建及算法工程化部署,推动实际业务场景落地;
2、参与建设后训练技术如SFT、RLHF等在Agent实际场景中落地;
3、参与Agent链路中的Reward model模型建设,加速业务演进。
包括英文材料
机器学习+
学历+
算法+
Python+
还有更多 •••
相关职位

logo of xd
实习技术大类

实习职责: 1. 参与多模态生成模型(如图像生成方向)的数据处理、基础训练及测试工作; 2. 将深度学习图形图像领域技术结合游戏场景进行创新研究; 3. 参与图像-文本数据集的整理、标注及质量评估; 4. 跟踪和复现部分前沿生成式AI相关论文或开源项目; 5. 配合团队完成技术调研、文档撰写及结果可视化展示。

更新于 2025-11-25上海
logo of ztgame
实习实习生

聚焦探索实时可交互视频生成方向,产出高水平学术成果与影响力技术落地。 专项课题: 研究方向一:实时视频生成范式探索 1. 实时视频生成范式的探索,系统性验证AR或AR+Diffusion视频生成方案; 2. 尝试垂直领域AR生成范式和AR生成范式在数据上的scaling law和智能涌现能力; 3. DiT视频生成效率提升,包括但不限高效率、低精度损失、高压缩比的视频VAE和tokenizer、包括稀疏架构、MoE等DiT结构探索。 研究方向二:长视频生成的一致性保持 1.DIT范式,AR范式 和 AR + DiT范式下的视频生成记忆框架实现与调研,包括但不限于3D 世界模型表征记忆,预测帧缓存与重用机制 和 用户状态与意图记忆等; 2.基于隐式视觉记忆机制(跨时间追踪关键环境状态),探索无需显式3D建模的动态场景表征,支持对场景物体、光照、环境的长期记忆存储与检索。

更新于 2025-08-13上海
logo of kuaishou
实习D0001

1、参与多模态生成算法的调研和分析,如Diffusion Models 、 GAN 、 VAE 、 Autoregressive Models等,包括但不限文本/图像/视频生成,解决生成质量、多样性、可控性、采样效率、可编辑等问题; 2、参与多模态生成算法的基础模块的研发,如 VAE、CLIP、LLM 等; 3、协助多模态生成算法的效果分析、数据优化、行业调研 等。

更新于 2025-02-12北京
logo of quark
实习日常实习生

1. 主导或参与图像/视频生成大模型的核心算法研发,聚焦扩散模型及VAE的前沿架构创新优化,完成大规模分布式训练、数据流水线构建及算法工程化部署; 2. 推动视觉生成技术在夸克多产品线的场景化落地,解决实际工程问题,实现从算法原型到工业级系统的端到端优化; 3. 开展前沿算法研究,探索多模态后训练、可控生成及推理加速等方向,保持算法的领先性。

更新于 2026-01-11杭州|上海