字节跳动高级研发工程师(推理优化方向)-TRAE
任职要求
1、本科及以上学历,计算机相关专业,三年及以上研发经验; 2、具备扎实的软件开发基本功,熟练掌握C/C++/Golang/Java/Python中至少一种编程语言; 3、具备优秀的学习能力、能…
工作职责
团队介绍:TRAE(The Real AI Engineer),是字节跳动旗下产品,一个能理解需求、调动工具、独立完成开发任务的 AI 工程师,为用户提供端到端生成真实软件的服务。TRAE是当前国内最受欢迎的AI编程产品之一,也是全球首个端到端AI软件开发Agent产品,可覆盖简单到复杂全场景。我们正在寻找充满热情、富有创造力的人才。期待你的加入,与我们共同重塑开发范式,定义未来开发的形态。 1、探索并打造基于LLM的下一代生产力工具,重点围绕软件研发场景(包括代码托管、代码分析、IDE等各工具平台)、实现LLM赋能; 2、探索并打造企业级LLM应用研发基础设施,建设LLM应用开发的接入平台及基础框架能力; 3、集合应用场景进行LLM推理优化,提升推理性能,降低服务成本。
团队介绍:TRAE(The Real AI Engineer),是字节跳动旗下产品,一个能理解需求、调动工具、独立完成开发任务的 AI 工程师,为用户提供端到端生成真实软件的服务。TRAE是当前国内最受欢迎的AI编程产品之一,也是全球首个端到端AI软件开发Agent产品,可覆盖简单到复杂全场景。我们正在寻找充满热情、富有创造力的人才。期待你的加入,与我们共同重塑开发范式,定义未来开发的形态。 1、探索并打造基于LLM的下一代生产力工具,重点围绕软件研发场景(包括代码托管、代码分析、IDE等各工具平台)、实现LLM赋能; 2、探索并打造企业级LLM应用研发基础设施,建设LLM应用开发的接入平台及基础框架能力; 3、集合应用场景进行LLM推理优化,提升推理性能,降低服务成本。
团队介绍:TRAE(The Real AI Engineer),是字节跳动旗下产品,一个能理解需求、调动工具、独立完成开发任务的 AI 工程师,为用户提供端到端生成真实软件的服务。TRAE是当前国内最受欢迎的AI编程产品之一,也是全球首个端到端AI软件开发Agent产品,可覆盖简单到复杂全场景。我们正在寻找充满热情、富有创造力的人才。期待你的加入,与我们共同重塑开发范式,定义未来开发的形态。 1、探索并打造基于LLM的下一代生产力工具,重点围绕软件研发场景(包括代码托管、代码分析、IDE等各工具平台)、实现LLM赋能; 2、探索并打造企业级LLM应用研发基础设施,建设LLM应用开发的接入平台及基础框架能力; 3、集合应用场景进行LLM推理优化,提升推理性能,降低服务成本。
1、负责AI平台推理部署核心功能开发,包括服务管理、部署、发布等模块 2、设计并实现推理服务的自动化运维体系,包括监控、告警和运维工具 3、开发服务编排和调度系统,实现资源的高效分配和负载均衡 4、构建平台运维API和SDK,提供完整的服务生命周期管理能力 5、优化平台整体架构,提升系统可用性、扩展性和性能
负责智能客户运营等多个产品的算法研发与落地,机器学习建模、前沿技术追踪、大语言模型Large Language Model (LLM) 技术在各垂类业务场景落地的核心技术攻坚等。 比如智能运营助手、营销答疑助手、营销Agentic Workflows构建等场景的大模型落地,提升内外部用户的服务效率和用户体验。 职位描述: ‒ 负责基于通用基座大模型结合领域数据构建营销服务领域大模型,包括但不限于如下场景的营销LLM关键技术攻坚: 1. 大模型落地业务场景识别 2. 垂域数据清洗 / 构造 3. 垂域LLM的后训练 4. 搜索增强RAG 5. LLM Agents 6. LLM推理加速 ‒ 探索基于大模型技术的营销场景服务新形态,包括多场景下的大模型对话机器人、智能辅助Copilot、Agentic Workflow大模型在实际业务场景中的落地,打造营销领域的AI Agent标杆。