logo of quark

夸克智能信息-千问&夸克-视觉算法专家-广州/北京/杭州

社招全职2年以上技术类-算法地点:广州 | 北京 | 杭州状态:招聘

任职要求


1. 计算机科学、电子工程、数学或相关专业本科及以上学历
2. 3年以上视觉算法开发经验,有移动端算法优化经验优先
3. 熟悉OpenCVOpenGLMetal等图像处理框架以及常用的机器学习框架(如TensorFlow、PyTorch、MNN、NCNN等)
4. …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责千问&夸克App的多模态应用(图像方向,包括AI生图、AI图片编辑、AI视频,端侧智能修图agent等)的端侧图像处理能力,包括智能滤镜、美颜、美体、特效算法设计、开发与优化
2. 研究和实现人脸、身体关键点检测等计算机视觉算法
3. 针对移动端(iOS/Android/鸿蒙)进行算法优化,确保高性能和低功耗
4. 与产品、工程团队合作,将算法集成到实际产品中
包括英文材料
学历+
算法+
OpenCV+
OpenGL+
Metal+
还有更多 •••
相关职位

logo of quark
社招3年以上运营-产品运营

千问-图像增长策略-产品运营 岗位职责 1、负责图像视频的用户增长,梳理产品的核心卖点,制定各渠道用户增长计划,管理投放预算并评估投放效果,对该产品线的拉新促活负责 2、结合时下热点,挖掘端内爆款AI特效或AI模板,帮助渠道运营团队实现在信息流、达人/素人等多个渠道获客 3、配合产品运营和研发算法团队,针对核心人群特征,优化新用户承接链路,提升用户在APP内的核心行为渗透及留存等关键指标 4、深入研究市面上主流或新兴AI创作类产品的营销增长玩法,策化创意性增长方案并推动落地

更新于 2025-12-03北京|广州
logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 团队致力于优化Qwen基础大模型的Agent能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent的工作包括从模型侧通过 SFT、RL等提升模型的基础agent能力,让模型和 agent框架有效结合;同时也包括agent system的设计与实现,致力于agentic AI真实落地。 1. 从事Qwen基础大模型的通用agent能力优化,包括但不限于tool use、RAG、planning、memory等能力的算法研发和优化;跟进业界agent benchmark,保持Qwen的agent行业领先水平。 2. 推进agentic AI的发展,包括但不限于多模态 agent、code agent、MCP、deep research 等场景的模型优化与产品落地。 3. 研发agent system,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 agent 的评估与测试工作,确保模型的稳定性和有效性。

更新于 2025-08-18北京|杭州|上海
logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 通义千问(Qwen)全模态统一理解生成前沿技术研究,团队在多个方向上进行探索(具体如下罗列),若你对以下一个或者多个课题感兴趣均欢迎投递: 1. 模型架构与学习机制探索 (1)预训练与后训练技术:持续提升模型的理解力、推理力与泛化能力。 (2)探索下一代学习范式,如自监督学习、动态训练策略、知识蒸馏等。 2. 多模态与多智能体感知交互系统 (1)打造 Omni 基座模型,实现文本、语音、视觉等多模态一体化理解与生成,推动世界模型的发展。 (2)开发超智能的 Coding Agent,打通语言与代码之间的桥梁,连接 AI 与数字世界。 (3)构建下一代 AI 交互系统,在 GUI Agent、视频理解等前沿场景,探索 AI 自主执行、扩展、进化的可能性。 3. 数据建设与性能优化 (1)数据工程:设计高效的数据处理管线,持续提升自然语言、代码、多模态等数据质量与规模。 (2)推理优化:探索模型高并发服务下,算法及系统框架侧技术创新与优化,包括但不限于训练推理协同优化、模型推理新范式。 4. 评测与安全体系 (1)构建下一代大模型评估系统,覆盖推理、生成、可控性等多个维度。 (2)关注模型内生安全,追求 AI 对人类有益且可控,参与对抗攻击检测、伦理约束建模等工作。

更新于 2025-08-18北京|杭州|上海
logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 团队致力于实现理解生成一体化的世界模型,达成“交互”和“创造”两大目标。本方向专注于研发视觉生成技术的突破,其中研究内容包括但不限于:理解生成一体化、视觉生成等,充分探索相关数据及训练方法研究,以期解决计算机视觉基本问题的同时,为 AI 赋予创造力,理解世界及预测未来世界。 工作描述: 1. 下一代理解生成一体化的模型结构设计与研发,探索 Autoregressive LLM 、Diffusion、及两者结合的多种技术路线。 2. 研究及探索世界模型的多模态训练数据及对应训练策略。 3. 设计及研发自动化评估方法设计与实现,为模型研发提供科学指导。

更新于 2025-08-18北京|杭州