新浪微博AI大模型算法工程师
任职要求
1. 计算机、数学或相关专业本科及以上学历,NLP领域实习经验 2. 有自然语言处理领域任一方向经验,包括并不限于文本分类、相似性、多模态生成、问答系统、知识图谱、大规模预训练模型,能够从业务场景出发建设技术体系能力。 3. 具备扎实的编程功底,和较强的工程实现能力,精通python语言和PyTorch、Transformer、DeepSpeed、Megatron-LM/vLLM等常见LLM模型训练相关框架。 4. 掌握业界领先大模型的基本原理、训练和微调方法,例如GPT系列、LLaMa系列、Qwen系列、deepseek系列等。 5. 熟悉并使用过langchain、llama-index、graphrag等RAG知识库开源框架。 具备以下条件优先: 1、 发表过AI顶会论文、或者AI竞赛获奖者优先 2、有优秀AI方向开源项目者优先
工作职责
大模型算法工程师 1. 负责微博AI应用的研发、探索,落地到微博内容理解、内容消费和内容创作的核心场景。 2. 负责大模型算法开发,基于微博海量数据分析及大模型训练技术,如大模型增量预训练、高效微调、RLHF以及推理优化,提升大模型效果。 3. 负责大模型应用落地,掌握基于大模型Prompt提示学习技术,取得业务成果,包括数据建设、知识库检索、提示工程、模型效果评估等。 4. 负责跟踪和研究agentic RAG系统的关键算法,持续提升检索和生成性能。 5. 跟进AIGC方向研究前沿,使用最新技术解决实际业务问题。
1.负责HR领域大模型在业务场景的应用落地; 2.调研大模型的业界前沿算法,追踪最前沿的技术动态,并应用在相关的项目中; 3.结合RAG、模型微调、MCP等大模型算法技术,提升AI在业务场景的效果。
1. 大模型研发与调优:独立设计、开发适用于 OTT 推荐系统、AI agent 的大模型,通过参数调整、轻量化压缩、多模态融合等技术优化模型性能,降低计算资源消耗; 2. 推荐系统算法优化:基于协同过滤、深度学习推荐模型(如 DIN、DeepFM 等),结合 OTT 业务场景优化推荐策略,提升内容推荐的精准度、多样性及用户点击率、留存率; 3. AI agent 开发落地:设计 AI agent 架构与智能交互策略,实现自然语言处理、任务执行、多轮对话等功能;通过强化学习提升其自主决策与学习能力,适配 OTT 场景服务需求; 4. AI 硬件算法适配:针对第二曲线 AI 硬件(如智能电视芯片、边缘计算设备),优化 AI 算法与硬件特性的结合,提升模型部署与运行效率,充分利用硬件资源; 5. 跨部门协作推进:协调研发、算法、设计、运营等跨部门资源,推动 AI 产品全流程开发,通过项目会议同步进展、解决问题,确保产品按时高质量交付; 6. 行业生态与商业探索:跟踪 AI 行业前沿动态与技术趋势,整合内外部资源,探索 AI 产品的新商业模式与应用场景,提升产品市场竞争力与商业价值。
vivo AI研究院致力于研发业界领先的人工智能技术,通过AI技术创新持续为全球5亿+vivo用户带来无处不在的惊喜和激动人心的智慧体验。 1、围绕多模态大模型的前沿研究,聚焦跨模态融合、知识推理与表达等核心问题,推动视觉、语音、文本等多模态智能体的理论和算法创新; 2、主导大模型端侧化与高效部署技术攻关,聚焦模型轻量化算法:量化、压缩、剪枝、蒸馏,以及模型推理加速、端侧模型训练等前沿课题,推动大模型在移动终端和边缘设备的实际落地; 3、深入探索强化学习与奖励模型的新范式,致力于提升泛化性和自学习能力,推动基于自博弈(Self-Play)的下一代智能体训练方法; 4、推动生成-理解统一建模、多模态世界模型构建等创新方向,实现虚拟与现实环境中的多模态交互与理解; 5、参与国际顶级学术会议/期刊论文发表,推动前沿技术在实际产品中的转化,提升公司在AI领域的学术与产业影响力。