百度AI Search引擎高级研发工程师(J84193)
任职要求
-熟悉C++/Java等编程语言,熟悉数据结构和算法等基础知识 -熟悉系统结构原理和编程(多线程编程、网络编程、高并发高性能调优) -有较强的责任心,良好的沟通协作能力,较强的学习能力 -加分项:熟悉常见的大数据组件和数据库原理和源代码(包括但不限于doris, clickhouse, es,impala, presto…
工作职责
-建设面向AI场景的检索引擎(多维分析、文本检索、向量检索、多模检索等) -负责计算引擎:包括但不限于SQL解析规划器,查询优化器,分布式执行研发和优化 -负责存储引擎:包括单机执行引擎,资源调度,列式存储、存算分离等模块的研发和优化 -负责各集群服务稳定性保障和客户支持
团队介绍:阿里国际以AI技术驱动,助力全球数字贸易及电商生 态的发展。AlBusiness是阿里国际内部集大模型研究 及智能化前沿产品研发于一体的AI部门,自研面向跨境商贸增强的多语言大模型-Marco和多模态大模型 -Ovis,依托全球化的AI基础设施和算力资源,帮助 AliExpress、Lazada、Alibaba国际站、Trendyol、 Daraz等平台全面革新跨境电商全链路的经营体验和 商业效率。基于先进的大模型与工程技术,我们正在打造新一代的智能体(Agent)和智能引擎(Deep Search)产品,持续致力于让全球商业没有语言障碍,用智能帮助跨境贸易更加简单。 职位描述 1. AI平台建设:负责AI应用平台的能力建设、架构设计和开发工作,推动平台技术的不断创新和优化。 2. RAG&多模态搜索能力:负责RAG、搜索工程架构相关平台能力建设 3. 大模型AI应用开发:深入电商业务及各职能场景,面向AI native范式,重构业务流程、产品能力和工作模式,显著提升业务效果和工作效率。
关于我们: 我们是一支全球化、多元化、专业化的数据先锋团队,以技术为引擎,以数据为纽带,驱动全球20亿消费者与数千万商家的数字化商业生态。立足中国,服务全球,每天处理覆盖东南亚、欧洲、美洲等多时区的跨境数据洪流,在多语言、多文化、多法规的复杂场景中,打造“数据&AI技术驱动业务”的全球化数据中台。 团队致力于构建全新的满足安全合规的国际化大数据架构体系;统一的用户/商品/商家资产体系建设,含统一的DMP和选品平台;面向海外商家数据服务的生意参谋及数据银行支撑业务全链路数据驱动闭环,打造从站外竞对机会发现到商品供给和用户增长的数据智能服务Agent平台。我们秉承简单开放、创新能力、匠心精神的团队文化; 职位描述 Job Description 1. 深入理解行业业务逻辑与用户生命周期,通过用户行为分析、消费心理建模、多源数据融合,诊断业务增长瓶颈,设计可落地的用户价值提升策略(如会员分层运营、场景化精准触达、流失用户挽回等)。 2. 主导端到端增长项目:独立完成从业务需求拆解->实验设计->用户特征工程->预测模型开发(如客户分群/LTV/传播裂变因子挖掘)->策略效果归因的全流程。 3. 搭建业务分析框架:结合行业特性(如电商高频转化、内容平台沉浸度驱动、金融行业信用风险维度),设计可解释的用户标签体系与归因模型,输出用户洞察报告指导产品迭代与运营策略。 4. 与搜索推荐、产品、运营团队紧密协作,推动增长实验、A/B测试落地,结合AI模型结果,持续优化产品与内容分发策略。 5. 支撑用户增长策略的算法能力沉淀与平台化建设,推动AI在个性化推荐、多模态建模、用户行为预测等方向的深度应用。 1. Drive business growth strategies through deep user analytics and lifecycle value modeling, focusing on solving real-world problems like member tier operation, scenario-based engagement, and churn recovery. 2. Own full-cycle projects from business diagnosis to deployment: 3. Develop industry-specific frameworks: Design interpretable user tagging systems and attribution models tailored to sector characteristics (e-commerce conversion loops, content engagement drivers, etc.) 4. Collaborate closely with Search & Recommendation, Product, and Operations teams to run growth experiments and optimize strategies based on AI insights. 5.Contribute to platform-level capability building for scalable, AI-powered growth solutions across personalization, multi-modal modeling, and user behavior prediction.
团队介绍:国际电商是以TikTok为载体的电商业务(也称为TikTok Shop),致力于成为用户发现并获取优价好物的首选平台,在直播电商、视频内容电商、货架电商等多场景下,国际电商希望能为用户提供更个性化、更主动、更高效的消费体验,为商家提供稳定可靠的平台服务,致力于新奇好物畅销全球,美好生活触手可得的使命。 Data-电商团队是国际电商的核心算法技术力量,专注于电商领域的算法创新,帮助用户高效发现感兴趣的商品,保障用户的购物安全,提升交易各环节的智能化水平。在这里,你将与一流的产品和技术团队合作、钻研,一起应对技术和业务上的挑战,推动技术在电商场景的深度落地。 课题介绍: 国际电商生态中沉淀了用户行为、商品图文、多媒体内容、商品销量与物流时序等海量异构数据,但传统模型在长周期预测、跨模态理解及复杂决策推理上仍存在明显瓶颈。 本课题拟以大模型为基础,联合构建面向国际电商场景的基础大模型,将用户、商品、内容、物流与库存等关键信息统一建模,并在其之上设计可插拔的Agent框架,系统整合任务规划、工具调用、多轮交互与环境感知等能力,从而在需求预测、流量分发与个性化推荐等链路中实现端到端的智能决策。 课题挑战: 1、异构融合与对齐:统一建模用户行为序列、商品销量时序信号与多模态商品内容,完成高维时序与图文表征的深度语义对齐; 2、推荐大模型与世界模型协同:把推荐问题定义还原为用户推荐列表的生成问题,基于大模型的技术完成端到端推荐建模; 3、推荐物品的Tokenizor:如何把亿级别的物品进行多模态和特征语义编码,支撑后续训练和生成任务,处理几十TB级别的用户行为Tokens的预训练,通过模型结构和训练方式拉高Scaling Law曲线,把各类推荐任务重构为后训练任务,以RLVR的思路进行推荐任务建模,最大化GMV和体验价值,训练推理优化,基于SGLang 等大模型推理套件定制构建高性能的推荐服务; 4、电商多模态大模型:构建面向电商领域的多语言多模态大模型,在核心电商场景达到SOTA性能,并以此为基础打造电商智能体基座,广泛支撑各类电商场景下的Agent应用落地; 5、Agent评测与安全合规:构建贴合实际业务的Agent评测指标与基准,保障在强约束、强对抗环境下的稳定性、安全性与合规性。 课题价值: 1、技术价值:打造通用多模态基座,以模型、数据、算力迭代实现幂律增长,夯实规模化技术底座; 2、业务价值:搭建国际电商大模型底座,以生成式推荐、时序大模型、Agent等驱动GMV与留存,打造高杠杆营收引擎。 Topic Content: In today’s global e-commerce landscape, intelligent systems must operate across increasingly complex and dynamic business environments. Yet existing approaches still face limitations in long-horizon forecasting, cross-modal understanding, and holistic decision-making.This initiative is focused on building a next-generation foundational large model purpose-built for global e-commerce applications. The model will integrate key business dimensions—such as users, products, content, logistics, and inventory—into a unified representation to support deep, context-aware intelligence at scale.Building on this foundation, we are developing a modular, agent-driven architecture that enables advanced capabilities including task planning, tool use, multi-turn reasoning, and real-world environment interaction.Together, these innovations aim to power end-to-end intelligent decision-making across critical e-commerce scenarios, including demand forecasting, traffic optimization, and personalized recommendation systems. Topic Challenges: 1.Heterogeneous fusion and alignment; 2.Synergy between recommendation LLMs and world models; 3.Tokenizer of recommendation items; 4.Multimodal large models for e-commerce; 5.Agent evaluation, safety, and compliance. Topic Value: 1.Technical value: Building a general-purpose multimodal foundation to enable power-law scaling through iterative advancements in models, data, and compute, thereby strengthening the infrastructure for scalable AI foundations; 2.Business value: Establishing a global e-commerce foundation model to drive GMV growth and user retention through generative recommendation, time-series large models, and agent-based systems, ultimately creating a high-leverage revenue engine.
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。