logo of quark

夸克智能信息-多模态大模型算法专家/高级专家-杭州/北京

社招全职2年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学、人工智能、机器学习或相关领域的硕士或博士学位;
2. 在多模态、计算机视觉NLP、AIGC、计算机图形学、机器学习等一个或多个领域有较深入的研究;
3. 具有出色的分析、解决问题的能力,能深入解决大模型训练、应用存在的问题,有自主探索解决方案的能力者;
4. 能够积极创新, 乐于面对挑战, 负责敬业,优秀的团队合作精神,一起探索新技术,推进技术进步。
加分项:
1. 具有优秀的基础算法、扎实的机器学习基础,在CVPRECCVICCVNeurIPSICLRICML、SIGGRAPH或SIGGRAPH Asia等顶级会议/期刊上发表论文者优先;
2. 具有优秀的代码能力,在ACM/ICPC、NOI/IOl、Top Coder、Kaggle等比赛获奖者优先;
3. 在多模态、大模型、基础模型、世界模型、RL、渲染生成领域,主导过大影响力项目者优先。

工作职责


1. 探索研究多模态理解、多模态生成、计算机视觉、自然语言处理、音频等前沿技术;
2. 参与研发多模态、全模态大模型等下一代人工智能核心技术,探索大规模/超大规模多模态理解与生成交织的基础模型,提升大模型能力;
3. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。
包括英文材料
机器学习+
学历+
OpenCV+
NLP+
大模型+
算法+
CVPR+
ECCV+
ICCV+
NeurIPS+
ICML+
Kaggle+
相关职位

logo of quark
社招3年以上技术类-算法

1. 探索研究多模态生成大模型的设计与开发,探究高效生成、生成理解统一、多模态理解、强化学习/RLHF后训练和高效数据管线设计等方向; 2. 参与研发多模态生成大模型开发等下一代人工智能核心技术,参与大规模生成基础模型预训练与后训练开发。 3. 负责跟踪和研究多模态生成大模型前沿技术调研、落地、对业务进行优化。

更新于 2025-08-22
logo of quark
社招2年以上技术类-算法

1. 负责语音合成、语音识别、端到端语音交互大模型算法的基础研究和应用落地; 2. 参与语音合成与识别技术在业务场景落地,解决落地过程中的前沿问题,持续优化语音合成与识别核心技术效果; 3. 深入调研和关注音频/NLP/多模态/全模态等方向的前沿技术,持续探索语音技术的新能力和新应用。

更新于 2025-09-19
logo of quark
社招5年以上技术类-算法

主导通用AIAgent(对标Manus等前沿形态)的核心算法研发与技术落地,带领团队攻克大模型驱动下的信息搜集、智能决策、智能办公等关键技术难题,构建具备搜索增强、自然对话能力的新一代通用智能体,支撑业务在多领域的创新应用。 具体职责: 1.算法研发与创新:牵头通用AIAgent的核心算法设计,包括但不限于大模型微调与强化学习、智能规划与决策、多模态信息融合、搜索增强机制等,持续提升Agent的通用性与任务执行能力。 2.场景落地与优化:聚焦搜索、对话等核心应用场景,主导算法方案的落地实施,结合业务需求迭代优化模型效果,解决实际场景中的技术瓶颈(如上下文理解、意图识别、多轮交互连贯性等)。 3.团队管理与赋能:带领5-10人算法团队开展研发工作,制定技术研发计划,统筹项目进度,搭建高效协作机制;指导团队成员成长,提升团队整体技术水平与创新能力。 4.技术攻坚与前瞻布局:跟踪国内外通用Agent、大模型领域的前沿技术动态(如顶会论文、行业实 践),主导技术预研与攻关,推动技术成果转化,保障团队技术竞争力。 5.跨部门协作与国际化支持:与产品、业务等部门深度协作,明确技术需求与落地路径;若涉及海外业务,需主导适配海外场景的算法优化,提供国际化技术支持。

更新于 2025-10-13
logo of amap
社招技术类-算法

我们是致力于成为AI驱动的本地生活服务革新者,通过大模型技术重构餐饮、零售、到店服务等核心场景的业务逻辑。 岗位使命 将本地生活领域复杂的业务场景转化为大模型可理解的数字孪生体,通过算法应用的创新实现从用户需求理解到服务交付的端到端智能化重构。 核心方向 1. 重构传统业务,实现端到端简化 2. 构建到餐、到综、酒旅等领域知识图谱,建立百万级商户服务与用户需求的动态匹配 3. 运用多模态业务理解大模型,实现对非结构化服务数据(菜单、评价、商品等)的深度理解和使用 4. 研发基于大模型的商品识别、智能匹配、选品选货、价格力等决策模块

更新于 2025-07-23