夸克千问事业部-AI图像&视频编辑研发专家-智能创作
任职要求
1. 精通 C++,熟悉面向对象与模板编程,熟悉 Objective-C/Swift(iOS)或 Java/Kotlin(Android); 2. 熟悉图像处理算法(滤镜、色彩空间、图像变换、边缘检测等),了解视频编解码(H.264/H.265、FFmpeg 等),了解图像格式(PNG、JPEG、WebP、HEIF 等)与视频格式(MP4、MOV 等); 3. …
工作职责
1. 负责千问AI智能创作业务(AI生图、AI图片编辑、AI视频)开发工作,图像与视频编辑工具开发方向; 2. 主导跨平台(iOS/Android/鸿蒙/PC/Web)图像/视频编辑 SDK,包括滤镜、特效、裁剪、合成等; 3. 基于 C++ 实现核心算法与渲染引擎,确保性能与稳定性; 4. 把控技术方案设计,优化图像/视频处理性能,包括内存管理、多线程、GPU 加速等; 5. 与产品团队紧密合作,持续关注行业动态和用户反馈,通过技术手段升级Agent能力,为用户创造全新AI Native体验。

1. 负责千问AI智能创作业务(AI生图、AI图片编辑、AI视频)开发工作,图像与视频编辑工具开发方向; 2. 主导跨平台(iOS/Android/鸿蒙/PC/Web)图像/视频编辑 SDK,包括滤镜、特效、裁剪、合成等; 3. 基于 C++ 实现核心算法与渲染引擎,确保性能与稳定性; 4. 把控技术方案设计,优化图像/视频处理性能,包括内存管理、多线程、GPU 加速等; 5. 与产品团队紧密合作,持续关注行业动态和用户反馈,通过技术手段升级Agent能力,为用户创造全新AI Native体验。
1. 负责千问AI智能创作业务(图像方向,包括AI生图、AI图片编辑、AI视频,端侧智能修图agent等)的端侧图像处理能力,包括智能滤镜、美颜、美体、特效算法设计、开发与优化; 2. 研究和实现人脸、身体关键点检测等计算机视觉算法; 3. 针对多平台(iOS/Android/鸿蒙/PC/Web)进行算法优化,确保高性能和低功耗; 4. 与产品团队紧密合作,持续关注行业动态和用户反馈,通过技术手段升级Agent能力,为用户创造全新AI Native体验。

1. 负责千问AI智能创作业务(图像方向,包括AI生图、AI图片编辑、AI视频,端侧智能修图agent等)的端侧图像处理能力,包括智能滤镜、美颜、美体、特效算法设计、开发与优化; 2. 研究和实现人脸、身体关键点检测等计算机视觉算法; 3. 针对多平台(iOS/Android/鸿蒙/PC/Web)进行算法优化,确保高性能和低功耗; 4. 与产品团队紧密合作,持续关注行业动态和用户反馈,通过技术手段升级Agent能力,为用户创造全新AI Native体验。
1、针对具体任务场景(如语音识别、机器翻译、图像理解、文本生成等),开展深度学习模型的算法设计与创新,探索新型神经网络架构(如Transformer、MoE、扩散模型等),提升模型在复杂环境下的准确性、鲁棒性与泛化能力。负责端到端建模优化,结合上下文理解、对话状态追踪或多模态融合技术,增强系统在连续交互场景中的语义理解与响应能力。构建高质量训练数据体系,设计自动化语料清洗、标注与增强方案,覆盖多语言、多方言、噪声或小样本等挑战性场景,支撑模型持续迭代。 2、参与大规模预训练模型(LLM、VL模型等)的研发与微调,包括指令微调、对齐优化、提示工程及推理加速,提升模型在下游任务中的表现。探索大模型在跨模态理解(图文、音视频)、实时生成、知识推理等场景的应用路径,推动AIGC、智能摘要、自动字幕、翻译等业务的技术升级。研发高效微调技术(LoRA、Adapter等)与模型服务架构,实现大模型在资源受限环境下的灵活部署。 3、推动模型轻量化与推理加速,应用模型压缩、量化、蒸馏、剪枝等技术,提升模型在移动端、边缘设备或云端的运行效率。协同工程团队完成算法模块的高性能集成,优化分布式训练与推理框架,保障系统低时延、高并发与稳定性。支持多平台部署(移动端、PC端、Web端、云服务),参与全链路性能调优与监控体系建设。 4、跟踪人工智能领域最新研究进展(CV/NLP/ASR/TTS/MT等),结合业务需求进行技术预研与原型验证。与产品、数据、工程团队紧密协作,深入理解用户场景,推动AI能力在实际产品中的创新应用。