字节跳动大模型算法专家/工程师(代码智能方向)-TRAE
任职要求
1、硕士研究生及以上学历,计算机、软件工程、人工智能等相关专业; 2、具有数据建设、指令微调和模型建设经验,具备优秀的代码能力、数据结构和基础算法功底; 3、熟悉大模型训练、RL算法者优先;在大模型领域,主导过大影响力的项目或论文者优先; 4、出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题; 5、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。
工作职责
团队介绍:TRAE(The Real AI Engineer),是字节跳动旗下产品,一个能理解需求、调动工具、独立完成开发任务的 AI 工程师,为用户提供端到端生成真实软件的服务。TRAE是当前国内最受欢迎的AI编程产品之一,也是全球首个端到端AI软件开发Agent产品,可覆盖简单到复杂全场景。我们正在寻找充满热情、富有创造力的人才。期待你的加入,与我们共同重塑开发范式,定义未来开发的形态。 1、负责代码场景的效果优化,深入研究LLM后训练等相关技术,提高算法准确率和效率; 2、分析业务需求,设计并实现适用于不同场景的算法解决方案,支持产品线在算法方面的需求; 3、持续跟进LLM前沿技术,基于LLM完成在代码领域中的复杂任务。
团队介绍:TRAE(The Real AI Engineer),是字节跳动旗下产品,一个能理解需求、调动工具、独立完成开发任务的 AI 工程师,为用户提供端到端生成真实软件的服务。TRAE是当前国内最受欢迎的AI编程产品之一,也是全球首个端到端AI软件开发Agent产品,可覆盖简单到复杂全场景。我们正在寻找充满热情、富有创造力的人才。期待你的加入,与我们共同重塑开发范式,定义未来开发的形态。 1、负责代码场景的效果优化,深入研究LLM后训练等相关技术,提高算法准确率和效率; 2、分析业务需求,设计并实现适用于不同场景的算法解决方案,支持产品线在算法方面的需求; 3、持续跟进LLM前沿技术,基于LLM完成在代码领域中的复杂任务。
- AI能力研发:基于钉钉智能财务与智能差旅的产品场景(如发票OCR识别、费用分类、预算预测、差旅行程推荐等),设计并实现AI算法模型,实现应用场景落地,提升智能化水平。 - 服务端架构开发:构建高并发、高可用的服务端系统,支持AI模型的在线推理与实时响应,保障企业级业务稳定性。 - 数据与算法工程化:完成从数据采集、清洗、建模到部署的全流程闭环,推动AI模型在生产环境中的落地与迭代优化。 - 跨团队协作:与产品经理、前端工程师、算法专家协同,将AI能力深度集成到钉钉智能财务与差旅产品中,实现业务价值。 - AI工具链建设:探索qwen等大模型的应用场景,通过提示词工程、模型微调等技术优化用户体验。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent; 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent; 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。