阿里巴巴阿里国际站/Alibaba.com-LLM算法工程师/专家-Accio-杭州
任职要求
1、硕士及以上学历,计算机、电子、人工智能、自动化、数学、物理、等相关专业优先; 2、深入理解ChatGPT/LLaMA/Qwen等LLM模型及算法原理,具备大语言模型相关研究/落地经验者优先,包含而不限于Post-Training、数据构造和评测体系建设经验;熟悉LLM-based Chatbot技术原理者优先; 3、熟悉LLM-based Chatbot技术原理者优先;熟悉LLM Post-Training训练数据构建方法,以及Multi-Agent系统框架者优先; 4、具有良好的问题分析解决能力,沟通协作能力,工作积极主动,能够与团队融洽合作,一起探索新技术,推进技术进步。 加分项 1、具有扎实的机器学习基础,熟悉CV、NLP、RL、ML、多模态理解、搜推广等领域的技术,在ICML、…
工作职责
Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品,也是全球首个B2B AI Search Agent,通过持续探索Agent、LLM、VLM、RL、Memory、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,实现全球B2B跨境贸易跨越式发展。 1、参与跨境电商多语言多模态大模型研发,包括而不限于Post-Training、SFT、RLHF、RL、Memory等全链路建设; 2、负责AI Native专项能力建设,包括而不限于RAG System、Agent System、Function Call、Reasoning、Agentic RL、Proactive Agent、LangChain; 3、探索LLM前沿技术,持续迭代自研模型能力,推动Native AI Agent落地,重构B2B跨境贸易交互体验。
关于我们 我们是阿里巴巴国际数字商业集团-阿里巴巴国际站-Accio算法团队。阿里巴巴国际站是全球最大的跨境B2B数字化贸易平台。 我们团队一直追求极致的技术创新 (每年都有多篇顶会paper),从Bert到T5,多次推动业务跨越式发展。去年自研LLM完整技术栈,成功驱动生意助手大规模商业化落地。今年正在全力打造全球首个B2B AI Sourcing Agent,自研Agent框架和全新AI Search系统,目前已成功全球发布,迈向更广阔的未来。 职责描述: 1. 负责跨境电商垂直多语言多模态大模型的研发,包括SFT到RLHF的LLM全链路post-training技术建设。 2. 负责AI Native专项能力建设,包括但不限于NL2SQL, RAG System, Agent System, Function Call, Workflow Reasoning等。 3. 负责跨境电商AI创新业务落地,包括但不限于用最前沿的RAG/Agent技术,重构B2B Sourcing的全新交互体验。 4. 负责LLM的前沿技术探索,持续迭代自研模型能力,支撑AI Native产品落地。
我们是阿里国际-Accio算法团队。Accio是阿里巴巴集团的战略级AI原生应用产品,也是全球首个B2B AI Search Agent,我们通过持续探索Agent、LLM、VLM、RL、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,驱动实现全球B2B电商贸易业务跨越式发展。 职位描述: 1. 负责开发和优化AI原生的全网搜索系统,包括但不限于文本和多模态模型训练、跨模态生成与检索、生成式搜索技术等; 2. 负责搜索系统算法设计与实施,负责搜索系统中的query理解、召回、相关性、排序等关键模块的算法设计与优化; 3. 负责全网商家/商品的Deep Research、全网询盘Agent链路的设计、实现和优化,负责将业界的SOTA Agent模型在业务场景中落地。
我们是阿里巴巴国际数字商业集团 - Accio 工程团队,正在打造全球 B2B 电商领域首个 AI Agent 产品(www.accio.com)。 我们致力于突破传统电商的局限,利用 AI 技术重构跨境贸易的作业流——从趋势洞察、新品研发、全网寻源、多模态匹配,到商家验证。我们在做一个能够处理复杂商业逻辑、具备深度辅助决策能力的智能终端,探索技术在 B2B 复杂场景下的赋能边界。 * 构建高适应性的 Agent 交互架构: 主导设计能够动态响应 AI 推理结果的组件协议与通信机制。你需要解决当后端返回非结构化、流式(Streaming)甚至不确定的数据时,前端如何通过稳健的架构实现精准的 UI 渲染与状态管理,确保用户体验的流畅性与确定性。 * 探索“人机协同”的下一代体验: 深入参与 Agent 业务逻辑设计,负责将前沿的 AI 交互范式(如生成式 UI、多轮对话上下文管理、主动式交互)转化为可落地的工程代码,在浏览器端实现高密度的信息聚合与复杂的富交互功能。 * 建立 AI 时代的工程化标准: 负责 Agent 产品的研发效能与质量体系。面对 AI 带来的长链路延迟与随机性挑战,建设专门的端侧性能优化方案、全链路可观测性平台以及针对 AI 输出的自动化评测(Eval)机制,保障产品在极端场景下的稳定性。
中台稠密引擎组,是小红书负责建设通用深度学习训练推理引擎的团队,面向全公司LLM、多模态LLM、SD、传统CV&NLP等稠密计算型模型训练与推理的业务场景,打造高效、易用、业界领先的训练与推理引擎,为小红书社区、商业化、安全等众多业务方向提供先进的引擎能力,支撑业务持续提升训练推理效率、模型迭代效率与算法研发效率。 1、参与设计和实现深度学习后训练及微调的前沿算法(包括但不限于RFT、RLHF等),以适应多样化的业务场景; 2、结合业务数据和场景,评估选择最适合的微调算法,以支撑业务大语言模型(LLM)微调指标的提升; 3、与数据团队紧密合作,深入理解数据特性,参与设计实现数据提质算法引擎工具,产出高质量数据集提升模型微调效果; 4、与公司内各算法团队深度合作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 5、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性;