字节跳动高级研发工程师(推理优化方向)-TRAE
任职要求
1、本科及以上学历,计算机相关专业,三年及以上研发经验; 2、具备扎实的软件开发基本功,熟练掌握C/C++/Golang/Java/Python中至少一种编程语言; 3、具备优秀的学习能力、能…
工作职责
团队介绍:TRAE(The Real AI Engineer),是字节跳动旗下产品,一个能理解需求、调动工具、独立完成开发任务的 AI 工程师,为用户提供端到端生成真实软件的服务。TRAE是当前国内最受欢迎的AI编程产品之一,也是全球首个端到端AI软件开发Agent产品,可覆盖简单到复杂全场景。我们正在寻找充满热情、富有创造力的人才。期待你的加入,与我们共同重塑开发范式,定义未来开发的形态。 1、探索并打造基于LLM的下一代生产力工具,重点围绕软件研发场景(包括代码托管、代码分析、IDE等各工具平台)、实现LLM赋能; 2、探索并打造企业级LLM应用研发基础设施,建设LLM应用开发的接入平台及基础框架能力; 3、集合应用场景进行LLM推理优化,提升推理性能,降低服务成本。
团队介绍:TRAE(The Real AI Engineer),是字节跳动旗下产品,一个能理解需求、调动工具、独立完成开发任务的 AI 工程师,为用户提供端到端生成真实软件的服务。TRAE是当前国内最受欢迎的AI编程产品之一,也是全球首个端到端AI软件开发Agent产品,可覆盖简单到复杂全场景。我们正在寻找充满热情、富有创造力的人才。期待你的加入,与我们共同重塑开发范式,定义未来开发的形态。 1、探索并打造基于LLM的下一代生产力工具,重点围绕软件研发场景(包括代码托管、代码分析、IDE等各工具平台)、实现LLM赋能; 2、探索并打造企业级LLM应用研发基础设施,建设LLM应用开发的接入平台及基础框架能力; 3、集合应用场景进行LLM推理优化,提升推理性能,降低服务成本。
团队介绍:TRAE(The Real AI Engineer),是字节跳动旗下产品,一个能理解需求、调动工具、独立完成开发任务的 AI 工程师,为用户提供端到端生成真实软件的服务。TRAE是当前国内最受欢迎的AI编程产品之一,也是全球首个端到端AI软件开发Agent产品,可覆盖简单到复杂全场景。我们正在寻找充满热情、富有创造力的人才。期待你的加入,与我们共同重塑开发范式,定义未来开发的形态。 1、探索并打造基于LLM的下一代生产力工具,重点围绕软件研发场景(包括代码托管、代码分析、IDE等各工具平台)、实现LLM赋能; 2、探索并打造企业级LLM应用研发基础设施,建设LLM应用开发的接入平台及基础框架能力; 3、集合应用场景进行LLM推理优化,提升推理性能,降低服务成本。
【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性