阿里巴巴1688-大模型算法高级工程师-杭州
任职要求
1.硕士及以上学历,计算机、数学、统计学相关专业优先; 2.2年及以上NLP、预测、运筹、推荐等领域相关经验,对业界主流算法有较深理解,有较强的编程能力,熟悉pytorch、tensorflow等框架,熟练掌握Tensorflow…
工作职责
1.负责1688商家与商品的长周期需求预测,提升商家生意企划与生意解决方案的效果保障 2.负责1688商家经营端商品认知与品类规划垂直大模型,包括市场需求预测、供给需求匹配等,提升商家Agent的决策规划能力 3.负责1688商家全店生意企划与经营Agent开发,提升商家经营体验与效率 4.跟踪业界前沿算法进展,结合1688商家经营的业务场景,探索多模态、MOE和生成式决策等LLM能力的落地应用方案
1. 负责大模型(LLM/MLLM)核心技术研发,包括预训练、垂域SFT、RLHF等,持续追踪和应用领域最新技术进展; 2. 负责大模型性能优化:研发模型加速技术,如量化、剪枝与知识蒸馏;优化数据特征与调度策略;构建高效推理链路、提升运行速度及降低成本; 3. 基于淘天用户丰富的消费行为,打造技术先进的电商用户理解大模型,提升对用户的异构行为本质的认知能力,支撑用户个性化的搜索、商详、互动等多种电商业务场景; 4. 基于淘天海量商品数据,打造技术先进的电商多模态大模型,提升对多模态异构的商品数据(图、文、视频等)的理解能力和结构化能力,输出底层算法能力和高质量结构化数据,支撑多种电商业务场景,并面向商家和消费者探索AIGC等创新业务应用; 5. 持续跟踪、探索大模型/多模态大模型方向的前沿技术,将各方向的SOTA能力集成到模型底座上,提升下游任务的效果,打造团队的技术先进性。
1. 高质量垂域数据工程:深入优化垂直领域(如文本内容审核)的高质量数据构建与迭代方法论,持续提升数据的质量、多样性与生产效率。 2. 可扩展后训练体系:探索适配领域特性的 SFT/RL 算法,构建高效、稳定、可扩展的垂域模型后训练范式,系统性提升模型能力。 3. 前沿技术研究与落地:探索推理模型前沿技术(如高效蒸馏、reward system、agentic RL、test-time learning 等)以及模型可解释性技术,沉淀技术成果和影响力,并推动大模型相关技术在行业场景中的转化与落地,提升领域模型竞争力,支撑业务持续增长。
职位描述 1、负责人工智能大模型的研发工作, 研发基于大模型的AI搜索、用户理解、ChatBot、检索增强、导购助手等应用,确保产品的创新性与实用性 2. 深度参与AI搜索类产品建设工作,主导大语言模型(LLM/MLLM)的预训练、持续训练、SFT、RLHF 等技术,不断提升模型的性能与表现。 3. 推动 AI 应用落地搜索场景,深入分析业务需求,通过技术手段提升作业效率与用户体验; 4. 持续关注行业内人工智能技术的发展趋势,引入前沿技术并进行创新应用