logo of liauto

理想汽车【基座模型】-智能体服务技术专家

社招全职5年以上汽车研发地点:北京状态:招聘

任职要求


1. 计算机/数学/电子工程等相关专业本科及以上学历
2. 精通分布式系统原理,熟悉CAP定理、一致性协议、分布式事务等核心概念
3. 具备5年以上Golang/C++分布式系统开发经验,熟悉gRPC、Thrift等RPC框架设计与性能优化
4. 熟悉业界常…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责智能体架构体系中的分布式推理服务核心模块设计与开发,构建高吞吐、低延迟的分布式推理系统
2. 研发分布式推理任务调度、负载均衡、容错恢复等关键算法,优化资源利用率与系统稳定性
3. 设计模型并行/流水线并行等分布式推理策略,解决超大规模模型的部署难题
4. 开发分布式推理加速技术(包括计算图优化、分布式KV Cache存储、通信优化等),提升系统性能
5. 实现分布式服务监控与动态扩缩容机制,保障高并发场景下的服务质量
包括英文材料
学历+
分布式系统+
CAP+
Go+
C+++
RPC+
还有更多 •••
相关职位

logo of antgroup
社招5年以上技术类-开发

1. 面向大模型、具身智能、AI眼镜等场景,建设AI安全的测评与防御平台,科学评估AI安全水位,并为高并发业务大模型服务场景提供低打扰防御能力。 2. 深入了解大模型在业务应用中的安全问题,对智能体服务的的工具、知识、大模型应用提供系统性安全解决方案,解决AI与硬件结合的应用安全问题,在人与AI交互的过程中守护AI应用安全底线。 3. 通过语料去毒、再训练、强化学习等手段持续将大模型应用的安全政策与基座模型对齐。 4.不断探索技术新领域,推动技术能力的沉淀和技术氛围的建设。

更新于 2025-06-10上海
logo of sf
社招5-10年

基座大模型研发与创新 参与设计并研发面向大规模多元时间序列的预训练基座模型,探索适用于时序数据的 Transformer变体(如Informer,FEDformer, PatchTST)及创新架构。 负责构建超大规模,高质量的时序预训练数据集,设计掩码重建,上下文预测等自监督预训练任务。 研究时间序列中的关键问题,如长周期依赖建模,多尺度特征提取,缺失值处理,以及时序与文本/事件等多模态信息的对齐与融合。 模型深度优化与领域适配 针对特定高价值场景(如电力负荷预测,量化金融,工业设备预测性维护),对基座模型进行深度微调与优化,实现"通用能力"到"领域专家"的转化。 研发高效的模型适配技术(如参数高效微调 PEFT),确保基座模型能够快速,低成本地适配到多样化的下游任务。 系统工程与高性能推理 负责将模型从研究原型推进到稳定,高性能的生产级系统。优化训练框架,利用混合并行(数据并行,模型并行,流水线并行)技术实现千亿参数模型的分布式训练。 主导模型的高效推理优化,应用量化(INT8/ FP4),编译优化等技术,大幅降低服务延迟与资源消耗,支撑海量时序数据的实时预测需求。 技术前瞻与行业赋能 追踪时间序列分析,大模型预训练的前沿学术进展,并将有潜力的技术引入到产品研发中。 与业务团队紧密合作,深入理解行业痛点,将基座模型的强大能力转化为可衡量的业务价值,定义时间序列预测领域的新标准。 岗位要求 必备条件 计算机科学,人工智能,统计学或相关专业硕士及以上学历(博士优先).

更新于 2026-01-06上海
logo of amap
社招2年以上技术类-算法

我们是高德视觉技术中心,驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。我们团队致力于利用三维重建、生成式世界模型、多模态大模型等技术打通虚拟与现实,探索空间智能技术路线,让算法在真实应用中产生即时经济价值与社会影响力。 团队gihub主页:https://github.com/amap-cvlab 岗位职责: 1. 3D动/静态生产:利用三维重建、生成模型、多模态大模型对单图、视频完成动态物体/静态场景重建、生成、编辑,并得到可交互的3D、长时序视频; 2. 世界模型构建:结合具身智能、自动驾驶等数据探索空间智能的统一范式,完成环境感知、智能体预测、决策规划等任务并得到未来状态和未来传感器信息,为强化学习提供基座; 3. 产线落地与性能优化:与具身智能、自动驾驶、智能导航等业务协同,完善仿真数据链路; 4. 跟踪学术界和工业界在生成式AI/世界模型相关领域的最新进展,保持公司在该领域的技术领先地位。

更新于 2025-11-27北京
logo of tongyi
社招3年以上技术类-算法

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 在此基础上,我们致力于研究Qwen面向具身智能领域的下一代基础模型,将Qwen强大的认知与推理能力赋予物理世界的机器人智能体,打破数字世界与物理世界的壁垒。团队的目标是研发能够理解人类意图、感知物理环境、并自主规划执行复杂任务的通用具身基础模型。我们相信,通过融合前沿的多模态大模型与机器人技术,我们将开创通用人工智能的下一个篇章,让AI真正走进并服务于现实生活。 工作职责: 1. 具身基础模型研究: 构建面向机器人的多模态基础模型,将视觉语言模型与机器人中心的物理世界理解与决策深度融合,构建具身领域的高质量的大规模真实与仿真数据集,设计并训练支持感知、动作、记忆、规划与语言理解统一的具身基础模型。 2. 测评基准建立:构建面向机器人多模态基础模型的能力基准,设计有效的测试基准,持续构建能反映基础模型在物理世界真实能力的高效测评系统。 3. 软硬件系统整合部署: 构建机器人软硬件一体化系统,将算法部署在真实机器人平台(如机械臂、人形机器人)上,进行端到端的验证与迭代,推动研究成果的实际落地。

更新于 2026-01-13杭州