快手大模型应用高级Java工程师
任职要求
1、本科及以上学历,计算机相关专业,有扎实的计算机基础知识和编程功底,良好的数据结构基础; 2、3 年及以上 Java 研发经验,有大规模分布式系统和产品的设计、开发和运维经验; 3、精通多线程编程,熟悉JVM,熟悉常见的开源分布式中间件、缓存、消息队列、数据库等; 4、有强烈的好奇心,对前沿技术保持敏…
工作职责
1、负责大模型应用的工程解决方案的设计与开发,推进大模型AI能力(LLM、VLM、MLLM等)在快手短视频、直播、电商等业务场景的快速落地; 2、理解业务逻辑与产品需求,设计和实现高可用技术方案、满足高并发、海量数据的挑战。持续改进提升系统性能和稳定性,降低推理硬件成本; 3、围绕大模型算法研发,建设高效率的AI模型迭代平台,包括数据标注与管理、模型训练、自动评测和部署,等全流程的工具平台建设。
职位描述: 1、参与大模型应用开发平台的设计、开发及应用工作,能主动发现技术⽀撑业务存在的瓶颈,支持公司内部大模型应用快速落地; 2、参与大模型应用开发平台技术架构解决方案,并参与技术研发和效果优化等工作,推动产品持续增长; 3、与前端、产品及运营团队密切沟通,按需求迭代更新并维护平台功能; 4、保障大模型应用系统的稳定、高效运行,帮助业务优化性能和改善系统稳定性; 5、加分项:支持国际版建设,包括多语言建设、多时区、海外场景等内容的设计开发工作
负责自营业务面向消费者端的公域搜推运营相关产品建设,主要使用java语言做业务系统开发。在团队中能够接触自营电商消费者链路,有机会通过海量商品的主搜诊断、成长、表达优化,全面提升自己的技术和业务能力。工作内容如下: 1、进行公域主搜运营链路的技术研发,主导技术方案设计和评审工作,进行项目管理和技术难点攻关; 2、深入理解业务,围绕业务的发展、产品需求等确定技术规划,并能够反向驱动业务的落地和发展; 3、解决各种疑难杂症问题、系统架构治理及性能优化工作,且完成业务产品建设和技术能力持续沉淀;
1. 核心架构设计:参与通义晓蜜下一代企业级对话Agent的技术架构设计,在准确率、响应延迟、成本控制之间寻找最优解,制定具备行业竞争力的技术方案。 2. 对话Agent工程化落地:负责对话Agent运行时的架构设计与开发,包括但不限于提示词工程、记忆、规划、工具调用以及复杂任务编排。 3. 高可用系统建设:针对大模型应用特有的长尾延迟和高并发挑战,优化系统吞吐与稳定性;主导代码Review,通过全链路调试与优化,确保线上服务的高可靠性。 4. 数据闭环建设:参与构建“人机协作”的数据反馈机制,通过线上数据回流反哺Agent能力的持续迭代。 5. 前沿技术跟踪与ConvAI规划,持续追踪业界ConvAI、Agentic Workflow、Multi-modal Interaction(多模态交互)等前沿技术动态。

1. 核心架构设计:参与通义晓蜜下一代企业级对话Agent的技术架构设计,在准确率、响应延迟、成本控制之间寻找最优解,制定具备行业竞争力的技术方案。 2. 对话Agent工程化落地:负责对话Agent运行时的架构设计与开发,包括但不限于提示词工程、记忆、规划、工具调用以及复杂任务编排。 3. 高可用系统建设:针对大模型应用特有的长尾延迟和高并发挑战,优化系统吞吐与稳定性;主导代码Review,通过全链路调试与优化,确保线上服务的高可靠性。 4. 数据闭环建设:参与构建“人机协作”的数据反馈机制,通过线上数据回流反哺Agent能力的持续迭代。 5. 前沿技术跟踪与ConvAI规划,持续追踪业界ConvAI、Agentic Workflow、Multi-modal Interaction(多模态交互)等前沿技术动态。