阿里巴巴阿里国际站-多语言算法工程师-杭州
任职要求
1、计算机科学/人工智能/NLP/机器学习/数学等相关专业本科及以上(硕士/博士优先)。 2、扎实的机器学习与深度学习基础,熟悉NLP/检索/推荐中至少一个方向的核心方法(Embedding、Rerank、LTR、对比学习、蒸馏、去偏等)。 3、具备多语言NLP或跨语种检索实战经验:例如 mBERT/XLM-R/mDeBERTa/多语言Embedding、…
工作职责
业务描述 1、我们为全球化电商搜索提供核心算法能力,面向多国家、多语言、多文化用户,打造世界级搜索体验,覆盖从“找得到”到“买得对”的全链路优化。 2、聚焦多语言Query理解与Query–商品相关性匹配能力建设,升级意图识别、实体与属性抽取、类目理解、跨语言语义对齐等关键模块,提升英语及多语种深度语义能力。 3、围绕搜索相关性主链路(召回、粗排、相关性模型、精排、重排)持续迭代,解决多语言场景下长尾Query、行为稀疏、样本不均衡、跨语种冷启动等挑战。 4、构建面向电商的多语言检索体系:结合稀缺小语种数据与海量英文/中文数据,实现跨语种迁移学习/对齐学习;同时引入知识库、类目体系与商品结构化属性,增强匹配可解释性与稳定性。 5、探索并落地大语言模型/多模态/Agent/RAG在相关性链路中的应用:如Query改写与扩展、跨语种语义归一、类目与属性补全、相关性打分与解释生成,并在工程上实现可控、低成本、可评估的线上闭环。 6、与产品、运营、工程团队协作,建立从离线评测到线上AB与人工评审(SBS)的指标体系,推动相关性提升转化为GMV、CTR/CVR、留存等业务收益。 职位描述: 1、负责多语言Query理解体系建设:语言识别、拼写纠错、分词/切词、实体识别、属性抽取、意图/类目预测、同义词与音译归一、单位与规格规范化等。 2、负责多语言相关性匹配模型研发与迭代:双塔/多塔Embedding召回(multilingual bi-encoder),支持跨语言向量空间对齐; Cross-encoder/Reranker 精排,强化细粒度语义与约束理解; 结合结构化特征(类目、品牌、属性、价格区间、地域合规等)实现更稳健的匹配。 3、负责训练数据与样本策略:多语言标注体系、弱监督构造、点击日志去偏、难负例挖掘、跨语种蒸馏与对齐训练、长尾与小语种的采样与增广。 4、构建相关性评估与诊断工具:多语言离线基准集、线上SBS评测、错误分桶(实体错配/属性冲突/类目漂移/翻译歧义/长尾覆盖)与自动归因。 5、工程化落地:向量索引/检索服务、低延迟推理、模型压缩与量化、灰度与回滚策略,保障线上稳定性与成本可控。 6、跟踪并评估前沿技术:LLM4Search、跨语种对齐、生成式检索、语义I
我们致力于构建支持通用人工智能发展的高质量、多模态大规模训练数据集,服务于图像、视频、文本等复杂模态融合下的大模型研发。该岗位将主导多模态数据基础设施的设计、处理流程的智能化优化,并深度参与高价值数据(如推理类任务数据、领域权威知识数据)的构建与增强,为模型的理解力、泛化能力与推理能力提供坚实数据支撑。 你将与算法工程师、数据产品经理紧密合作,共同推动数据与模型的正反馈闭环,包括数据构建策略共创、实验验证、产品化数据标准制定等,在万卡集群的充足算力支持下,实现“数据即能力”的宏大目标。 主要职责: 1.设计与维护高扩展性、多模态数据基础设施 支持图像、视频、文本等模态数据的高效采集、存储、调度与版本化管理,满足大模型多轮训练与快速迭代需求。 2.构建推理能力导向的数据集 主导构建具备复杂因果关系、长链思维、多跳推理、模态融合推理、多语言对齐推理等能力评估或训练所需的数据集,服务大模型“理解-生成-决策”闭环。 3.高性能并行数据处理优化 在CPU/GPU集群或分布式环境中优化大规模图像/视频/文本混合数据的处理性能,提升数据准备效率与稳定性。 4.构建可视化与分析工具,辅助数据理解与反馈闭环 实现多模态数据分布可视化、异常聚类检测与质量诊断,服务于模型训练前/中/后的数据决策优化。 5.与算法工程师深度协同,提升模型性能与数据对齐度 基于模型效果与损失分析,共同制定数据增强策略、采样分布设计、多轮训练数据构造方法,实现数据与模型迭代的高效协同。 6.与数据产品团队合作,推进数据标准化与平台化建设 参与数据标签体系、任务定义、多模态对齐协议等的标准制定,推动数据处理工具、标注平台、数据质量评估体系的产品化落地。
1、负责AI文本翻译相关技术研发,包括但不限于模型预训练,后训练,自动化评估,词翻译,小语种等方向,持续提升翻译信达雅能力; 2、负责AI图片翻译生成相关技术研发,包括但不限于OCR,图片涂抹,图像编辑等方向,提升多模态翻译体验。 3、负责翻译业务系统的数据训练、调试监控和部署落地,结合海外业务实际问题提出创新性的应用解决方案。
近年来,以大模型为核心的生成式人工智能技术在语言理解、内容生成、多模态建模与跨模态交互等领域取得了突破性进展,展现出前所未有的技术潜力与广泛的应用前景。 我们致力于面向通用人工智能(AGI)的前沿探索与产业落地创新。一方面,在迈向AGI的长期路径中,随着大语言模型能力的持续进化,多模态感知、融合与推理等关键问题日益凸显,成为构建通用智能系统的核心挑战;另一方面,围绕典型行业场景如何将现有大模型能力有效转化为可落地、可扩展、可持续的解决方案,也成为当前研究与工程实践的重点方向。 如果你对生成式AI、智能交互、智能软件工程,智能文档处理,数据挖掘,多语言内容的理解和生成,跨模态检索与理解,多模态智能体GUI Agent以及法律金融等方向的AI应用算法研发有浓厚兴趣,或者对于大模型应用落地有浓厚兴趣,欢迎加入我们,共同定义未来AI的能力边界,牵引千行百业在智能时代的深度变革。 1. 大语言模型算法创新:定义下一代大语言模型技术范式,实现文本、代码,语音、视觉等多模态信息的联合建模,探寻和解决对齐、推理、Agentic等方面的核心挑战,不断追寻通用大模型的效果上限。 2. 场景驱动的算法创新:结合上述业务场景,设计并优化大模型架构,研发低成本高效应用算法,提升效果、效率与鲁棒性。 3. 端到端技术闭环:从数据构建、模型训练、评测到部署,主导技术方案落地,通过AB实验、调用量、用户反馈验证价值。 4. 前沿应用技术探索:紧跟并能驱动LLM、Diffusion Models、强化学习等技术相关进展,定义技术新范式,快速实验并迭代创新方案,拉升相关模型在学术领域和应用场景的SOTA。
