通义代码大模型算法工程师
任职要求
1. 来自全球Top高校计算机科学、人工智能、机器学习、深度学习、软件工程、或相关领域应届毕业生,博士/硕士毕业生优先。 2. 在 code、agent 领域内有相关的研究或项目经历,对 competitive coding、agentic coding、vibe coding、GUI agent 有浓厚的兴趣。 3. 对代码数据、可执行数据敏感,有相关的过滤、清洗、重写的经验,相信以数据为中心的智能驱动范式。 4. 对verifiable task有热情,对environment fo…
工作职责
通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 Coder团队致力于构建能够执行、扩展并自我进化的自主系统,通过构建超智能的coding agent/digital agent,扩展数字世界,为迈向真实世界的智能奠定基础。 工作职责: 1. 负责通用模型 Qwen 的代码能力和代码专有模型 Qwen-Coder 的构建。 (1)包括但不限于数据收集、预训练、后训练(强化学习)、评测等方向上的探索。 (2)通过Large-scale Pre-training 和 Large-scaleRL来提升Code Reasoning能力,在专家级编程竞赛超越人类,并构建 Coding Agent 来解决真实世界软件开发任务; 2. 负责Computer-Use Agent (GUI-Agent)的建设,以最直观的方式—鼠标、键盘、编码等操作来代替人类执行数字世界任务。 (1)通过Scaling海量数字世界数据结合大规模合成数据,来提升Computer-Use Agent的Grouding能力。 (2)通过Long Horizon的方式进行强化训练,结合可扩展的多模态环境反馈来提升CU Agent的Reasoning的能力。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 工作职责: 1、参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)等类型模型的推理服务框架; 2、参与/负责KV Router、PD分离/EPD分离、KVCache管理、动态PD调整等分布式推理能力建设; 3、通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架; 4、参与/负责构建推理框架的系统容错能力,包括但不限于请求迁移、优雅退出、故障检测、自愈等能力建设; 5、深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、工作流编排等; 6、与全公司各业务算法部门深度合作,为重点项目进行算法与系统的联合优化,支撑业务目标达成。
岗位职责: 1、负责 AI Agent 系统的设计、开发和优化、开发和完善基于大语言模型 (LLM) 的智能体系统,提升 Agent 的自主决策和任务执行能力; 2、负责生成式大模型指令意图理解相关工作,整体提升大模型的多轮对话指令理解能力和性能; 3、设计并实现 Agent 的工具使用接口,实现与各类外部系统和 API 的集成编排; 4、负责大模型在检索、推荐方面的系统设计实现和优化,探索Agent、RAG、领域模型调优等相关技术在业务场景落地; 5、具备模型知识、幻觉机制探究,提升模型知识水平、降低模型幻觉率; 6、能够基于开源模型,设计和开发算法,对模型进行微调,优化其参数和结构,以提高模型的泛化能力和准确性; 7、深入调研AI领域相关的前沿技术,跟踪业内大模型领域的最新进展,并寻求将最新技术应用到产品的可能性。
1、LLM模型应用落地:参与LLM在搜索内部的应用,探索LLM的创新落地场景; 2、RAG技术研究与落地:参与RAG技术在搜索内部的应用与创新,提升快手搜索智能问答效果; 3、技术优化与创新:持续优化现有的算法技术,推动算法创新,不断业务效果和用户体验; 4、跨团队合作:与产品团队、工程团队和业务团队紧密合作,理解业务需求,将算法技术转化为实际的产品和解决方案; 5、算法评估与改进:负责对算法模型进行评估和改进,提高算法的准确性、效率和可解释性。