灵犀互娱大模型应用开发工程师
任职要求
1. 本科及以上学历,计算机、人工智能、软件工程、数学或相关专业; 2. 熟练掌握 Java、Python、Go、C++ 中至少一门编程语言,具备扎实的数据结构、算法基础、操作系统知识及良好的编程习惯; 3. 了解大模型应用开发原理,熟悉 Prompt Engineering、RAG…
工作职责
1. 负责将大模型(LLM)能力落地到实际业务场景,包括但不限于Prompt工程、智能对话、知识库建设、内容生成及业务流程自动化; 2. 设计并开发AI Agent系统及其框架,负责任务规划、多步推理(CoT)、工具调用(Function/Tool Calling)、记忆管理及多智能体协同等核心模块的实现; 3. 构建LLMOps全链路流程,包括大模型应用评测、监控告警、数据标注及RAG(检索增强生成)全链路优化(如切片算法、召回重排等); 4. 参与大模型业务应用平台的研发,推动MCP(模型控制协议)生态建设、工作流编排及代码生成等提效工具的开发,构建高可靠、高扩展的AI架构。
【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。
【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性
1、负责贝壳C端的后端服务设计与开发,保障高并发场景下的系统稳定性; 2、能够理解和分析产品需求,给出合理的技术方案和开发计划; 3、关注性能、微服务、设计模式,提升用户体验
岗位职责: 1、负责 AI Agent 系统的设计、开发和优化、开发和完善基于大语言模型 (LLM) 的智能体系统,提升 Agent 的自主决策和任务执行能力; 2、负责生成式大模型指令意图理解相关工作,整体提升大模型的多轮对话指令理解能力和性能; 3、设计并实现 Agent 的工具使用接口,实现与各类外部系统和 API 的集成编排; 4、负责大模型在检索、推荐方面的系统设计实现和优化,探索Agent、RAG、领域模型调优等相关技术在业务场景落地; 5、具备模型知识、幻觉机制探究,提升模型知识水平、降低模型幻觉率; 6、能够基于开源模型,设计和开发算法,对模型进行微调,优化其参数和结构,以提高模型的泛化能力和准确性; 7、深入调研AI领域相关的前沿技术,跟踪业内大模型领域的最新进展,并寻求将最新技术应用到产品的可能性。