logo of quark

夸克千问C端事业群-大模型智能化评测专家-杭州

社招全职3年以上技术类-质量保证地点:杭州状态:招聘

任职要求


1. 3-5 年测试工作经验,有多模态算法/大模型/音视频/图像算法等之一工作背景,有服务端算法测试、大模型评测,数据集构造等测试经验;
2. 具有自然语言处理计算机视觉、语言大模型、多模态大模型大模型评测、AIGC等相关经验优先;
3. 能够主导大型项目的整体测试工作,包括测试分析、测试用例落地、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责智能互联多模态算法测试,熟悉算法工程全链路评测,可以独立设计如图像处理算法(如目标检测、图像识别、OCR等)的评测方案,数据集,评测工程等,确保算法精度与性能符合需求;
2. 建设通用的基于大模型场景下的模型评估体系、评测框架及基础评测能力的建设,包括评测集完备性,合理性建设,评测结果智能化判定,能够基于业务需求设计评测方案,开展多维度模型评估,输出专业评测报告;
3. 追踪大模型方向前沿进展,积极主动地学习和探索新的评测及分析的方法和技术。主导项目全链路质量保障和风险识别工作,搭建质量技术保障体系、制定质量保障规范、推进测试工作执行;
4. 协同项目中多角色、多合作团队形成积极有效的沟通和互动,驱动问题解决,保障交付质量。主动创新,通过技术手段解决质量保障工作中的复杂技术问题,提升测试效能、加深质量工作技术积累。
包括英文材料
算法+
大模型+
NLP+
还有更多 •••
相关职位

logo of quark
社招2年以上技术类-算法

千问学习算法团队致力于使用AI技术重塑面向未来的学习体验。在这里您将与我们一起挑战前沿的产品技术问题,并收获服务千万级用户的成就感和影响力。 核心职责: 1. 主导教育场景下多模态大模型(文本/图像/视频)的全流程算法研发工作,包括数据构建、指令微调、RLVR、RLHF等关键环节 2. 针对教学场景设计专属后训练与微调方案(如解题步骤生成、作业批改、互动答疑等),提升核心模型的专业性与可用性 3. 跟进业界最新进展和SOTA模型和算法,并与教育场景特点进行深度结合,推动智能化教学和个性化学习落地

更新于 2026-02-03北京
logo of quark
社招2年以上技术类-算法

1. 负责千问学习核心智能体算法研发与优化,使用大模型实现题目理解与分析、AI学情诊断分析、学习规划等核心agent。 2. 负责智能学习助手算法研发与优化,包括大模型在智能决策、RAG、个性化推荐等领域的应用。

更新于 2026-02-03北京
logo of quark
社招4年以上技术类-算法

团队介绍: 1. 夸克搜索是追求极速智能搜索的先行者,为用户的信息获取提供极速精准的搜索体验。 2. 团队属于阿里巴巴智能信息事业部板块下核心技术部门,负责夸克搜索业务核心体验的优化与开发。 3. 团队内部算法和工程结合,可以依据个人兴趣和能力,深入探索更丰富的技术领域;同时团队氛围融洽且开放,追求简单、轻松、愉快工作氛围的同学不容错过。 4. 团队工作具有业务复杂度高、技术挑战大、技术栈全面等特点,高并发低延时,大数据存储及挖掘。 5. 团队紧跟业界前沿技术,演进和迭代业务架构和算法,支撑业务在行业竞争中处于优势地位。 岗位职责: 1. 负责设计、开发和持续优化用户画像算法模型,充分运用大数据、机器学习、深度学习以及大模型技术,构建高精度的用户画像,有力服务于个性化推荐、精准营销、用户行为分析等多元业务场景。从海量多源数据中高效提取关键特征,通过不断改进数据处理、特征工程、模型训练、模型评估等核心技术,显著提升用户画像模型的准确性和表现。 2. 主导设计和开发高效的知识库算法(涵盖数据处理、机器学习、深度学习等)与模型,全力提升知识库建设的效率、准确性及可靠性。承担知识抽取、知识融合、知识表示和知识检索等关键工作,完成知识库的构建、维护和优化,为各类模型的智能化应用提供坚实支撑。开展数据挖掘工作,开发数据打标、能力分层、自适应推荐等算法,显著提升推荐预测和个性化学习的效果。

更新于 2025-12-09北京
logo of quark
社招3年以上产品类-用户型

负责千问大模型与非手机智能硬件(如智能眼镜、手表、家居中枢、车载设备等)的深度融合,打造面向C端用户的场景化AI产品体验。聚焦“大模型+硬件”创新交互范式,将千问的多模态理解、自然对话、集团二方等能力与硬件使用场景有机结合,构建语音交互、情境问答、设备联动、个性化服务等核心功能。 主要职责: ● 深度洞察非手机硬件(可穿戴、IoT、车载等)的用户场景与交互约束,结合千问大模型能力边界(如端云协同推理、轻量化部署、多模态输入),与算法、硬件、工程、设计团队紧密协作,将技术能力转化为贴合硬件特性的用户价值与产品功能; ● 通过实地用户观察、场景化调研、行为数据埋点及A/B测试,持续优化硬件端交互流程(如语音唤醒效率、多轮对话容错、低功耗策略),提升用户满意度、留存率及场景渗透深度; ● 探索大模型在硬件端的创新应用,推动千问能力与硬件生态深度融合,构建差异化产品竞争力与用户心智。

更新于 2026-01-29北京|杭州