logo of quark

夸克智能信息-视觉算法专家-AI创新业务

社招全职2年以上技术类-算法地点:广州状态:招聘

任职要求


1. 计算机科学、电子工程、数学或相关专业本科及以上学历
2. 3年以上视觉算法开发经验,有移动端算法优化经验优先
3. 熟悉OpenCVOpenGLMetal图像处理框架以及常用的机器学习框架(如TensorFlowPyTorchMNN、NCNN等)
4. 在以下领域有深入研究和实践经验:
   - 人脸检测、关键点检测、人脸识别
   - 人体姿态估计、身体特征点检测
   - 图像美化、滤镜、特效算法
   - 深度学习模型在移动端的部署与优化
5. 了解移动端芯片特性(如GPU、NPU、DSP等),有端侧推理优化经验

工作职责


1. 负责夸克App的智能创作业务(AI生图、AI图片编辑、AI视频)端侧图像处理能力,包括美颜、美体、特效算法设计、开发与优化
2. 研究和实现人脸、身体关键点检测等计算机视觉算法
3. 针对移动端(iOS/Android/鸿蒙)进行算法优化,确保高性能和低功耗
4. 与产品、工程团队合作,将算法集成到实际产品中
包括英文材料
学历+
算法+
OpenCV+
OpenGL+
Metal+
图像处理+
机器学习+
TensorFlow+
PyTorch+
MNN+
深度学习+
相关职位

logo of quark
社招1年以上技术类-算法

1.负责基于开源或内部基础大模型,进行文生图、文生视频、图像/视频编辑等AIGC技术能力的精调、优化,持续提升用户体验。 2.深入探索Agent在智能创作等业务场景的应用,负责构建大规模Multi-Agent系统,并对视觉语言模型(VLM)进行高效的定制与微调,以驱动业务创新。 3.进行前沿AI应用方向的技术预研,跟踪并评估最新研究成果,主动探索其在业务场景中的可行性,并负责将有潜力的技术迅速落地为核心业务能力,驱动产品创新与运营效率提升。

更新于 2025-09-26
logo of quark
社招1年以上技术类-算法

1、利用SD、VLLM、LLM等AIGC相关技术参与图文生成、视频生成、智能化编辑,包括但不限于海报生成、动态海报、数字人等; 2、负责AI算法的架构设计与优化,针对不同业务场景提出通用性或定制化的解决方案; 3、结合实际业务需求,探索和解决新问题,并通过创新和改进推动团队整体能力提升。

更新于 2025-09-26
logo of quark
社招2年以上技术类-算法

1. 跨模态长程预训练:设计并实现文本、图像、视频等多模态对齐与融合的长程训练策略,操控万卡级 GPU 集群,协同 Pretrain / CPT / SFT / RLVR / RLHF 全链路,对超大参数基座模型进行高效分布式优化。 2. 前沿技术攻坚:深入探索 MoE 稀疏化、训练算法与对齐范式创新、可解释性与质量监控、多模态推理、mRAG、百万 Token 级长文处理、Agent&工具链机制等底层原理与技术。 3. 高性能训练框架持续升级:与系统团队共建张量并行、流水并行、混合精度等高性能训练框架,持续提升训练吞吐与稳定性。 4. 学术与行业影响力打造:快速跟踪 NeurIPS / CVPR / ACL 等顶会成果及开源项目,输出专利与论文,树立行业技术标杆 5. 高速驱动夸克AI相关业务:赋能夸克 AI 相机、AI 搜索·深度思考、DeepResearch、创意写作、AI 助手等核心产品,实现多模态能力的快速迭代与落地。 加入我们,你将获得    1. 顶尖资源:与行业专家并肩作战,万卡算力与海量数据随手可用,持续挑战技术天花板。    2. 高速成长:极具竞争力的薪酬福利与纯粹的工程师文化,为你的职业加速。    3. 时代机遇:亲历 AGI 关键技术的诞生与规模化应用,在智能时代留下你的名字。 如果你渴望驰骋于大模型与 AGI 的蓝海,这里就是你的最佳舞台。立即加入我们,共创智能新时代!

更新于 2025-09-28
logo of quark
社招3年以上技术类-算法

全面负责定义、设计并实现下一代对话系统的核心算法与交互范式,解决当前对话模型在多轮交互、知识应用、共情能力等方面的挑战,探索并引领模型在个性化、主动性、拟人化等前沿方向的技术突破。直接决定数亿夸克用户在Chat场景的与AI 的交互体验,塑造夸克在未来对话式 AI 时代的领先地位。 1. 对话体验定义与规划。深入分析用户意图与行为,结合业务场景,制定并执行对话体验的中长期技术演进路线图。并密切追踪并研究对话式 AI 领域的最新进展,包括主动式对话策略、多模态对话 (语音/视觉融合)、AI Agent 中的对话流控制等。您将主导定义“顶级对话体验”的标准,并将其分解为可落地、可量化的算法迭代目标。 2. 多轮对话与上下文理解。攻坚并解决长程、复杂多轮对话中的核心技术难题,包括但不限于指令遵循、上下文精准理解、长程记忆与遗忘机制、隐式意图识别等。您将设计创新的模型结构与训练策略,使模型具备真正连贯、有逻辑的对话能力。 3. 对话回复准确与全面。主导研发将外部知识 (如搜索、工具调用) 与大模型进行深度、动态融合的先进技术。致力于解决模型在对话中的意图偏离、事实性错误、内容不详实和知识更新不及时等问题,并通过 RAG 新范式或其他创新方法,显著提升对话的准确性与信息量。 4. 评测体系与数据飞轮。建立并完善一套科学、全面的对话能力评测体系,能够精准衡量模型的综合对话质量 (Coherence, Empathy, Informativeness 等)。设计并驱动高效的数据闭环系统,利用真实用户反馈持续、自动化地优化模型。

更新于 2025-10-17