阿里巴巴1688-大模型算法专家(AI搜索)-杭州
任职要求
1. 对LLM/MLLM模型、智能体(Agent)领域有深入的研究,熟悉常见LLM/MLLM模型,理解LLM的原理和架构,熟悉大模型在推荐、生成、检索增强(RAG)等方向的应用,有行业成功应用经验。 2. 具备扎实的机器学习/深度学习基础,熟练掌握深度学习框架,如PyTorch等,并对其底层原理有深入理解;对常用网络架构比较…
工作职责
1.负责人工智能大模型的研发工作, 研发基于大模型的AI搜索、用户理解、ChatBot、检索增强、导购助手等应用,确保产品的创新性与实用性; 2. 深度参与AI搜索类产品建设工作,主导大语言模型(LLM/MLLM)的预训练、持续训练、SFT、RLHF 等技术,不断提升模型的性能与表现; 3. 推动 AI 应用落地搜索场景,深入分析业务需求,通过技术手段提升作业效率与用户体验; 4. 持续关注行业内人工智能技术的发展趋势,引入前沿技术并进行创新应用。
1、负责AI搜索大模型算法整体工作。 2、负责大模型(含推理、多模态)及下游任务的训练及优化突破,包括但不限于:预训练、SFT、强化学习、混合专家等大模型核心训练技术 3、负责大模型在电商搜索和商品领域落地项目,涵盖用户个性化理解&意图识别,商品内容理解&结构化,行业知识库构建&知识标准化等任务 4、分析和解决大模型在领域应用中的技术难题并进行突破,并与业界先进技术进行持续对比 5、与产品和工程团队紧密合作,将先进的算法技术应用于实际产品开发,发挥算法在实际应用中的价值
1.负责LLM后训练、包含但不限于SFT、RL Reasoning相关算法的研究及开发。 2.负责多模态理解、Agent相关基础算法,生成式检索/排序相关算法的研究及开发。 3.拆解业务需求,形成技术方案,作为小组长和团队一起完成业务逻辑开发,实现各类算法在用户画像建模,商品理解及推荐,复杂Query意图识别及召回等业务场景的落地。

深入研究AI应用算法,探索LLM在深度推理、深度研究(Deep Research)、Code Agent、多模态Agent等领域的技术研究,包括 AI搜索,Plan、Tool Usage、Memory、Agent Reasoning、多模态理解等技术,推动AI技术在智能体产品应用中的突破。 探索工业级的Agent算法架构方案,提升Agent系统的执行效率和结果对齐准确度。在创新应用场景中,优化长上下文场景的Agent推理算法架构,提升Agent解决任务复杂度,探索System2技术边界。 针对重点方向如Agentic Search,Memory,进行端到端优化,包括系统算法框架设计、模型训练等,解决实际应用相关问题。 跟进大模型智能体前沿技术趋势,结合实际业务需求,将技术应用到实际业务场景;
