阿里云阿里云智能-大模型智能算法专家-杭州/北京
任职要求
1、计算机科学、软件工程、数学、统计学等相关专业,硕士及以上学历 2、具备独立的从业务需求到算法工程转化和落地能力,在自然语言理解NLU/自然语言生成NLG、对话机器人、搜索推荐、知识图谱等一个或多个领域有大规模场景落地经验 3、在大模型LLM相关技术方向有实战经验者优先,比如LLM训练和优化、Agent/Multi-Agent的…
工作职责
负责大模型Large Language Model(LLM)技术在云计算服务领域多个业务场景落地的核心技术攻坚,尤其是阿里云服务领域的数字员工的建设和落地,以及阿里云智能客服大模型对话机器人、智能辅助Copilot、服务体验等场景的大模型落地,提升内外部用户的服务效率和服务体验。 岗位职责包括但不限于: 1. 负责基于通用基座大模型(通义千问等)结合领域数据构建云计算服务领域大模型,包括大模型落地业务场景识别、数据清洗/构造,LLM训练和调优,搜索增强RAG,LLM Agents等LLM关键技术方向攻坚 2. 探索基于大模型技术的服务新形态,包括多个场景的数字服务小二,,智能辅助Copilot等云计算服务新形态场景的大模型落地技术,打造云计算服务领域“大模型落地”的标杆 3. 深入阿里云服务内外部业务场景,结合大模型技术、搜索推荐、多模态等算法模型能力解决云服务领域实际业务痛点,并参与规划和设计未来云服务领域的大模型技术演进规划和落地
1. 参与前沿AI技术探索与行业级产品落地的双轨发展战略,与顶尖团队协作攻克多模态理解与生成智能体系统的技术挑战,推动多模态RAG与智能体技术的产品化落地; 2. 设计并实现融合文本、图像、语音、视频等多模态数据的检索增强生成系统,优化跨模态语义对齐与知识检索能力; 3. 设计基于多模态大模型的智能体核心算法,实现任务规划、意图识别、工具调用及多智能体协作系统。
1. 负责大语言模型以及多模态大模型的预训练、精调等研发及落地; 2. 负责大模型智能体记忆、规划、工具、RAG能力的研发以及大模型应用的研发。 3. 跟进大模型与强化学习技术的前沿发展,提升算法效率与性能
1. 算法设计与开发 -针对云计算基础设施资源的需求计划、供需匹配、采购决策和库存管理等场景,建立数学模型并设计求解算法(如线性规划、强化学习、仿真推演等)。 -设计并研发基于大模型(LLM)智能问答(QA)、推理分析(如Chain-of-Thought, ReAct)的agentic AI助手,提升资源运营效率。 2. 工程落地与优化 -将算法从原型推进到生产环境上线,并可解决实际运营业务场景中的规模化和时效性挑战。 -提供运营业务人员可通过自然语言直接交互并高效可用的Agentic AI助手。 -与工程团队合作,设计高性能、可扩展的算法服务架构。 3. 跨领域协作 -与云产品(需求侧)、供应链、采购、数据中心运营等多个团队紧密合作,理解业务痛点并转化为可量化的技术问题。 -跟踪学术界(如OR、ML顶会)和工业界(如AWS/GCP资源优化方案)最新进展,推动技术迭代。
1. 算法设计与开发 -针对云计算基础设施资源的需求计划、供需匹配、采购决策和库存管理等场景,建立数学模型并设计求解算法(如线性规划、强化学习、仿真推演等)。 -设计并研发基于大模型(LLM)智能问答(QA)、推理分析(如Chain-of-Thought, ReAct)的agentic AI助手,提升资源运营效率。 2. 工程落地与优化 -将算法从原型推进到生产环境上线,并可解决实际运营业务场景中的规模化和时效性挑战。 -提供运营业务人员可通过自然语言直接交互并高效可用的Agentic AI助手。 -与工程团队合作,设计高性能、可扩展的算法服务架构。 3. 跨领域协作 -与云产品(需求侧)、供应链、采购、数据中心运营等多个团队紧密合作,理解业务痛点并转化为可量化的技术问题。 -跟踪学术界(如OR、ML顶会)和工业界(如AWS/GCP资源优化方案)最新进展,推动技术迭代。