阿里巴巴阿里国际站-多语言算法工程师-杭州

社招全职2年以上技术类-算法2026-02-02地点：杭州状态：招聘

扫码手机上打开

任职要求

1、计算机科学/人工智能/NLP/机器学习/数学等相关专业本科及以上（硕士/博士优先）。
2、扎实的机器学习与深度学习基础，熟悉NLP/检索/推荐中至少一个方向的核心方法（Embedding、Rerank、LTR、对比学习、蒸馏、去偏等）。
3、具备多语言NLP或跨语种检索实战经验：例如 mBERT/XLM-R/mDeBERTa/多语言Embedding、…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

业务描述
1、我们为全球化电商搜索提供核心算法能力，面向多国家、多语言、多文化用户，打造世界级搜索体验，覆盖从“找得到”到“买得对”的全链路优化。
2、聚焦多语言Query理解与Query–商品相关性匹配能力建设，升级意图识别、实体与属性抽取、类目理解、跨语言语义对齐等关键模块，提升英语及多语种深度语义能力。
3、围绕搜索相关性主链路（召回、粗排、相关性模型、精排、重排）持续迭代，解决多语言场景下长尾Query、行为稀疏、样本不均衡、跨语种冷启动等挑战。
4、构建面向电商的多语言检索体系：结合稀缺小语种数据与海量英文/中文数据，实现跨语种迁移学习/对齐学习；同时引入知识库、类目体系与商品结构化属性，增强匹配可解释性与稳定性。
5、探索并落地大语言模型/多模态/Agent/RAG在相关性链路中的应用：如Query改写与扩展、跨语种语义归一、类目与属性补全、相关性打分与解释生成，并在工程上实现可控、低成本、可评估的线上闭环。
6、与产品、运营、工程团队协作，建立从离线评测到线上AB与人工评审（SBS）的指标体系，推动相关性提升转化为GMV、CTR/CVR、留存等业务收益。

职位描述：
1、负责多语言Query理解体系建设：语言识别、拼写纠错、分词/切词、实体识别、属性抽取、意图/类目预测、同义词与音译归一、单位与规格规范化等。
2、负责多语言相关性匹配模型研发与迭代：双塔/多塔Embedding召回（multilingual bi-encoder），支持跨语言向量空间对齐；
Cross-encoder/Reranker 精排，强化细粒度语义与约束理解；
结合结构化特征（类目、品牌、属性、价格区间、地域合规等）实现更稳健的匹配。
3、负责训练数据与样本策略：多语言标注体系、弱监督构造、点击日志去偏、难负例挖掘、跨语种蒸馏与对齐训练、长尾与小语种的采样与增广。
4、构建相关性评估与诊断工具：多语言离线基准集、线上SBS评测、错误分桶（实体错配/属性冲突/类目漂移/翻译歧义/长尾覆盖）与自动归因。
5、工程化落地：向量索引/检索服务、低延迟推理、模型压缩与量化、灰度与回滚策略，保障线上稳定性与成本可控。
6、跟踪并评估前沿技术：LLM4Search、跨语种对齐、生成式检索、语义I

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

NLP+

还有更多 •••

登录查看完整学习资料

相关职位

千问C端事业群-千问/夸克-VLM训练与应用数据工程师-杭州/北京

社招2年以上技术类-算法

我们致力于构建支持通用人工智能发展的高质量、多模态大规模训练数据集，服务于图像、视频、文本等复杂模态融合下的大模型研发。该岗位将主导多模态数据基础设施的设计、处理流程的智能化优化，并深度参与高价值数据（如推理类任务数据、领域权威知识数据）的构建与增强，为模型的理解力、泛化能力与推理能力提供坚实数据支撑。你将与算法工程师、数据产品经理紧密合作，共同推动数据与模型的正反馈闭环，包括数据构建策略共创、实验验证、产品化数据标准制定等，在万卡集群的充足算力支持下，实现“数据即能力”的宏大目标。主要职责： 1.设计与维护高扩展性、多模态数据基础设施 支持图像、视频、文本等模态数据的高效采集、存储、调度与版本化管理，满足大模型多轮训练与快速迭代需求。 2.构建推理能力导向的数据集 主导构建具备复杂因果关系、长链思维、多跳推理、模态融合推理、多语言对齐推理等能力评估或训练所需的数据集，服务大模型“理解-生成-决策”闭环。 3.高性能并行数据处理优化 在CPU/GPU集群或分布式环境中优化大规模图像/视频/文本混合数据的处理性能，提升数据准备效率与稳定性。 4.构建可视化与分析工具，辅助数据理解与反馈闭环 实现多模态数据分布可视化、异常聚类检测与质量诊断，服务于模型训练前/中/后的数据决策优化。 5.与算法工程师深度协同，提升模型性能与数据对齐度 基于模型效果与损失分析，共同制定数据增强策略、采样分布设计、多轮训练数据构造方法，实现数据与模型迭代的高效协同。 6.与数据产品团队合作，推进数据标准化与平台化建设 参与数据标签体系、任务定义、多模态对齐协议等的标准制定，推动数据处理工具、标注平台、数据质量评估体系的产品化落地。

更新于 2025-12-09北京|杭州

天猫淘宝海外-高级搜索算法工程师-杭州

社招2年以上技术类-算法

天猫淘宝海外，背靠淘宝数十亿商品，结合不同海外市场挖掘消费需求，为海外消费者提供精准、个性化的购物体验。在这里，你可以无限发挥你对海外用户和中国供给的数据洞察，通过AI连接全球优质用户和中国金子般的供给，为全球化业务贡献你的智慧和热情！职位描述 1.研究多语言Query理解、商品理解和相关性算法，包括Query改写与扩展、Query类目预测、多语言语义相关性等； 2.升级召回算法，包括倒排索引检索、语义向量召回检索、个性化向量检索以及生成式商品检索等； 3.优化排序算法，包括用户超长行为序列建模、国家差异化建模、Transformer范式升级等； 4.迭代Query推荐，针对下拉、底纹等词导购场景，优化多语言query底池，升级Query排序模型等。

更新于 2026-04-07杭州

天猫淘宝海外-高级搜索算法工程师-杭州

社招2年以上技术类-算法

更新于 2026-04-07杭州

千问C端事业群-千问/夸克-VLM训练与应用数据工程师-杭州/北京

社招2年以上技术类-算法

更新于 2026-04-01北京|杭州