阿里巴巴淘天算法技术-大模型应用算法专家-杭州
任职要求
1. 对LLM/MLLM模型、智能体(Agent)领域有深入的研究,熟悉常见LLM/MLLM模型,理解LLM的原理和架构,熟悉大模型在B/C端的应用,有行业成功应用经验。 2. 具备扎实的机器学习/深度学习基础,熟练掌握深度学习框架,如PyTorch等,并对其底层原理有深入理解;对常用网络架构比较熟悉,比如Diffusion,Transformer。 3. 具备一定的学术背景,在顶会(如NeurIPS、ICLR、ICML等)或期刊上有论文发表者优先;有Multi-Agent,RLHF等方面的经验优先。 加分项: 在AI领域顶会或者期刊发表过论文者优先;
工作职责
1、负责淘天自营业务AI大模型的应用和研发工作,深度参与商品全链路智能运营工作、研发基于大模型的内容生成、优化的各项工作,参与ai助手和agent建设,负责大模型结合搜推相关的场景落地。 2、负责大语言模型、多模态大模型的预训练、持续训练、SFT、RLHF等技术,持续提升模型在业务场景应用的效果。 3.、深入分析业务需求,通过技术手段提升作业效率与用户体验,和工程侧同学一起探索AI相关创新产品。 4.、持续关注行业内人工智能技术的发展趋势,引入前沿技术并进行创新应用。
阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增、营销、大模型应用等技术。 团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。 ● 聚焦前沿大模型技术在电商场景的应用与创新,推动商品理解领域的智能化转型; ● 负责大模型算法的研究、优化及落地实施,涵盖大模型后训练、领域专用大模型、多模态大模型、RAG、Agent等前沿技术; ● 针对电商场景,探索并实现大模型在商品属性挖掘以及抽取,结合搜索及商家服务等环节中的应用,全面提升搜索体验与运营效率; ● 深入挖掘行业数据特性,与产品及研发团队紧密协作,将技术成果转化为实际产品竞争力。
1. 参与大模型Post-Training(SFT, RM, RLHF等)算法的研发与迭代,深入研究并解决训练过程中的效率瓶颈与收敛性问题,持续提升模型的逻辑、推理及生成能力,直接对用户体验负责。 2. 探索并实践面向各领域的高质量数据自动化合成技术(如Self-Instruct, Constitutional AI等),设计并构建高效、可扩展的线上数据飞轮(Data-Flywheel)闭环系统,实现模型能力的自我迭代与增强。 3. 与产品、工程团队紧密协作,洞察并挖掘LLM在企业垂直场景的巨大潜力,参与从0到1的创新产品孵化,推动技术成果的商业化落地。
1. 研发面向代码开发&风险的大模型,包括但不限于代码大模型、NLP、全模态、时序分析等领域相关的大模型的应用算法研发; 2. 基于强化学习,研发全模态(代码/运维/工具调用/操作界面图像等)的推理模型 3. 搭建深度搜索/工具调用/自动操作网页和手机/各种运维平台的agent 4.系统化的风险发现和应急算法搭建