夸克智能信息-多模态大模型算法专家/高级专家-杭州/北京
任职要求
1. 计算机科学、人工智能、机器学习或相关领域的硕士或博士学位; 2. 在多模态、计算机视觉、NLP、AIGC、计算机图形学、机器学习等一个或多个领域有较深入的研究; 3. 具有出色的分析、解决问题的能力,能深入解决大模型训练、应用存在的问题,有自主探索解决方案的能力者; 4. 能够积极创新, 乐于面对挑战, 负责敬业,优秀的团队合作精神,一起探索新技术,推进技术进步。 加分项: 1. 具有优秀的基础算法、扎实的机器学习基础,在CVPR、ECCV、ICCV、NeurIPS、ICLR、ICML、SIGGRAPH或SIGGRAPH Asia等顶级会议/期刊上发表论文者优先; 2. 具有优秀的代码能力,在ACM/ICPC、NOI/IOl、Top Coder、Kaggle等比赛获奖者优先; 3. 在多模态、大模型、基础模型、世界模型、RL、渲染生成领域,主导过大影响力项目者优先。
工作职责
1. 探索研究多模态理解、多模态生成、计算机视觉、自然语言处理、音频等前沿技术; 2. 参与研发多模态、全模态大模型等下一代人工智能核心技术,探索大规模/超大规模多模态理解与生成交织的基础模型,提升大模型能力; 3. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。
1. 探索研究多模态生成大模型的设计与开发,探究高效生成、生成理解统一、多模态理解、强化学习/RLHF后训练和高效数据管线设计等方向; 2. 参与研发多模态生成大模型开发等下一代人工智能核心技术,参与大规模生成基础模型预训练与后训练开发。 3. 负责跟踪和研究多模态生成大模型前沿技术调研、落地、对业务进行优化。
1. 负责语音合成、语音识别、端到端语音交互大模型算法的基础研究和应用落地; 2. 参与语音合成与识别技术在业务场景落地,解决落地过程中的前沿问题,持续优化语音合成与识别核心技术效果; 3. 深入调研和关注音频/NLP/多模态/全模态等方向的前沿技术,持续探索语音技术的新能力和新应用。
主导通用AIAgent(对标Manus等前沿形态)的核心算法研发与技术落地,带领团队攻克大模型驱动下的信息搜集、智能决策、智能办公等关键技术难题,构建具备搜索增强、自然对话能力的新一代通用智能体,支撑业务在多领域的创新应用。 具体职责: 1.算法研发与创新:牵头通用AIAgent的核心算法设计,包括但不限于大模型微调与强化学习、智能规划与决策、多模态信息融合、搜索增强机制等,持续提升Agent的通用性与任务执行能力。 2.场景落地与优化:聚焦搜索、对话等核心应用场景,主导算法方案的落地实施,结合业务需求迭代优化模型效果,解决实际场景中的技术瓶颈(如上下文理解、意图识别、多轮交互连贯性等)。 3.团队管理与赋能:带领5-10人算法团队开展研发工作,制定技术研发计划,统筹项目进度,搭建高效协作机制;指导团队成员成长,提升团队整体技术水平与创新能力。 4.技术攻坚与前瞻布局:跟踪国内外通用Agent、大模型领域的前沿技术动态(如顶会论文、行业实 践),主导技术预研与攻关,推动技术成果转化,保障团队技术竞争力。 5.跨部门协作与国际化支持:与产品、业务等部门深度协作,明确技术需求与落地路径;若涉及海外业务,需主导适配海外场景的算法优化,提供国际化技术支持。