深度求索深度学习研发工程师(AGI 北京/杭州)
工作描述: 1. LLM 的成功是 ai 基础设施的成功,这是一个相当复杂的系统工程。每个成功的大模型背后,都有无数个从硬件到软件,从存储调度到算子编译器的极致优化故事,最终将这个模型的训练效率推动到了极致。而我们的工作,就是将自己的特长发挥到极致,榨干硬件上的点滴性能,加速大语言模型的研究; 2. 一个人无法穷尽 AI 核心系统的方方面面,因此我们更希望你是某个领域的专家,比如高性能计算、RDMA 网络、模型框架、算子编译器等等,能以独特经验和独到观点,从不同维度优化系统,同时具有开阔的架构视野,能够灵活地选择合适的技术来构建系统。也希望你能认同我们开放共进的企业文化,积极创新,乐于挑战,整个团队一起互通有无,博采众长,来推动整个 AGI 的发展。
1. 操控万卡规模的 GPU 集群,对超大参数量级的预训练模型进行高效分布式训练与优化。 2.深度参与多模态(图像、语音、文本、视频)大模型的研发,探索多学科交叉领域的新奇玩法。 3.我们的技术将为夸克亿万用户提供高品质的AI智能服务,见证前沿技术实现真正的用户价值 加入我们,你将获得: 1.与顶级专家携手,以世界级算力资源和数据支持为背书,不断挑战技术极限。 2.极具竞争力的薪酬与福利,人性化、追求卓越技术的的工程师团队文化,助你在职业成长道路上全速前进。 3.在通往 AGI 的征途上,亲历关键技术的诞生与应用,留下属于你的时代印记。 如果你渴望驰骋在大模型与 AGI 的蓝海之中,那么这将是你的最佳舞台!快来加入我们,一同开创智能时代的新纪元。
模型评估的方法决定了我们训练什么样的大模型,构建AGI模型的第一步应当是思考我们如何评测模型。随着技术的快速发展,传统的评测逐渐不适应当前的模型能力,我们需要研发下一代大模型评估系统,从而实现让大模型更好地执行真实世界任务进而服务人类的目标。 工作职责: 1. 挖掘大模型弱点,持续快速构建覆盖各项模型能力的评测数据集,探索可靠、具有可扩展性的评测方案。 2. 参与 LLM-as-a-Judge 方案构建,训练 LLM Judge / Reward Model,建模人类偏好并提升长尾任务的评价准确性。 3. 参与 Reward System 构建,设计 Reward Signal、合成对应数据,并通过 RL提升模型的能力上限。 4. 参与开发 Evaluation、Reward System 所需工程框架,简化各类测试任务和模型集成流程,帮助提高团队效率。
夸克智能体团队致力于建设高度自主的大规模 AI Agent 系统,基于领先的工程基础与业务生态,已实现多领域多模态智能体的落地应用,在 AI 搜索、医疗健康、知识问答、智能创作、办公效率等核心场景形成深度应用。 我们诚邀具备扎实算法功底与研究潜力的优秀应届毕业生加入,围绕前沿 Agent 技术的进行探索与应用落地,共同推动智能体技术的发展,您将深入参与: 1. Agent 学习与优化:研究并实现前沿 Agent 训练算法,包括但不限于模仿学习、强化学习等,提升 Agent 的自主决策能力; 2. Agent 架构与能力建设:涵盖 Planning、知识检索、工具调用、长短时记忆等核心模块的设计与优化,构建高智能可扩展的 Agent 框架; 3. 多模态交互与理解:基于 LLM 与多模态技术,构建面向复杂场景的智能体交互系统,实现自然的人机协作; 4. 场景化应用与创新:深度结合业务需求,设计适配不同领域的专业 Agent,打造具备长期价值和强劲竞争力的智能助手产品。