阿里巴巴阿里国际-大模型算法工程师-北京
任职要求
学历要求:本科及以上(硕士、博士优先);计算机科学、数据科学、人工智能或相关专业背景; 技术能力: - 扎实的机器学习与深度学习基础,熟悉常用算法及模型结构; - 至少精通一门主流编程语言(Python、Java、C/C++其中之一或多种),具备分布式系统开发实战经验; - 熟练掌握Pytorch、Tensorflow或其他主流深度学习框架,具备大规模模型训练与调优经验; - 数据敏感度与逻辑分析能力出色,能够快速理解并处理海量行业数据; - 学习能力强,对新技术、新领域保持高度热情,并能迅速适应技术迭代的节奏; - 优秀的团队合作与沟通能力,能够跨部门协同推进项目进展; 加分项: - 拥有大模型、搜索推广、自然语言处理或计算机视觉等领域实际开发经验; - 在ACL、ICML、NeurIPS、ICLR、CVPR、KDD等顶级会议或期刊发表过高水平论文; - 具备产学研合作项目经验者优先考虑。
工作职责
● 聚焦前沿大模型技术在电商场景的应用与创新,推动商品理解领域的智能化转型; ● 负责大模型算法的研究、优化及落地实施,涵盖大模型后训练、领域专用大模型、多模态大模型、RAG、Agent等前沿技术; ● 针对电商场景,探索并实现大模型在商品属性挖掘以及抽取,结合搜索及商家服务等环节中的应用,全面提升搜索体验与运营效率; ● 深入挖掘行业数据特性,与产品及研发团队紧密协作,将技术成果转化为实际产品竞争力。
1. 参与大模型技术在研效领域的落地应用并解决应用过程中的技术难题,包括但不限于算法整体方案规划、模型设计调优、数据建设、模型部署与推理加速等; 2. 持续跟进业界算法前沿技术,包括大模型预训练、微调、强化学习等方向,在可能产生重大价值的技术领域预研并跟进产品孵化。
1. 参与基础大语言模型应用研发; 2. 结合机器学习、强化学习等技术优化基础大语言模型 3. 调研并探索SFT/RLHF方向前沿算法、框架,持续提升现有算法的效率与效果。 Responsibility: • Lead, collaborate, and execute on research that pushes forward the state of the art in large language model research • Use machine learning, reinforcement learning and other technologies to optimize fundamental large language models • Directly contribute to experiments related to supervised fine-tuning (SFT) and reinforcement learning from human feedback (RLHF), continuously improving the effectiveness of existing algorithms
1、负责大模型算法的研发与优化,提升模型在多语言场景下的性能和效率。 2、参与AI驱动的电商搜索解决方案设计,应用LLM技术进行Query理解和商品多模态理解。 3、跟踪业界最新技术动态,推动大模型在电商领域的创新应用。