百度代码大模型算法工程师(J85626)
任职要求
-具有优秀的代码能力和算法功底,在ACM/ICPC/NOI/IOI/Top coder 等比赛获奖者优先; -熟悉大模型领域的数据工程建设、预训练、SFT、RLHF等流程,具备实操经验及项目实践者优先 -有一定的学术能力,发表过AI顶会论文或参与大模型开源项目者优先
工作职责
-开展代码大模型的训练和优化,包括但不限于Code Pretrain、Alignment、RL等研发工作 -开展代码自动评估体系和代码沙盒环境建设,建设高质量代码能力体系和数据合成策略 -开展代码通用智能体研发,构建思考规划、工具调用、执行反馈等核心能力 -推动代码大模型在代码助手、无代码等业务场景的落地和迭代
-开展代码大模型的训练和优化,包括但不限于Code Pretrain、Alignment、RL等研发工作 -开展代码自动评估体系和代码沙盒环境建设,建设高质量代码能力体系和数据合成策略 -开展代码通用智能体研发,构建思考规划、工具调用、执行反馈等核心能力 -推动代码大模型在代码助手、无代码等业务场景的落地和迭代
通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 Coder团队致力于构建能够执行、扩展并自我进化的自主系统,通过构建超智能的coding agent/digital agent,扩展数字世界,为迈向真实世界的智能奠定基础。 工作职责: 1. 负责通用模型 Qwen 的代码能力和代码专有模型 Qwen-Coder 的构建。 (1)包括但不限于数据收集、预训练、后训练(强化学习)、评测等方向上的探索。 (2)通过Large-scale Pre-training 和 Large-scaleRL来提升Code Reasoning能力,在专家级编程竞赛超越人类,并构建 Coding Agent 来解决真实世界软件开发任务; 2. 负责Computer-Use Agent (GUI-Agent)的建设,以最直观的方式—鼠标、键盘、编码等操作来代替人类执行数字世界任务。 (1)通过Scaling海量数字世界数据结合大规模合成数据,来提升Computer-Use Agent的Grouding能力。 (2)通过Long Horizon的方式进行强化训练,结合可扩展的多模态环境反馈来提升CU Agent的Reasoning的能力。
1、研发面向云计算底座海量数据的大模型,包括但不限于代码大模型、全模态、大规模图学习等领域相关的大模型的应用算法研发; 2、参与大模型应用研发全流程的工作,包括但不限于模型算法设计、代码开发、训练、部署优化、调试、评测;技术创新如专利、论文的撰写;外部技术影响力交流等; 3、推动大模型在DevOps提效、内外部智能体业务应用、爆款AI原生应用、安全和技术风险防控等场景的业务落地;
我们致力于构建能够执行、扩展并自我进化的自主系统。我们相信解决Coding问题是实现 AGI 的关键路径。如果能构建一个超智能的 Coding Agent,那么和数字世界相关的工作都将随之被扩展,并为迈向真实世界的智能奠定基础。 工作职责: 1. 负责通用模型 Qwen 的代码能力和代码专有模型 Qwen-Coder 的构建。 (1)包括但不限于数据收集、预训练、后训练(强化学习)、评测等方向上的探索。 (2)我们坚持 Large-scale Pre-training 和 Large-scale RL 来提升 Code Reasoning 能力,在专家级编程竞赛超越人类,并构建 Coding Agent 来解决真实世界软件开发任务。 2. 负责 Computer-Use Agent (GUI-Agent)的建设,以最直观的方式—鼠标、键盘、编码等操作来代替人类执行数字世界任务。 (1)通过 Scaling 海量数字世界数据结合大规模合成数据,来提升 Computer-Use Agent 的 Grouding 能力。 (2)通过 Long Horizon 的方式进行强化训练,结合可扩展的多模态环境反馈来提升 CU Agent 的 Reasoning 的能力。