logo of tongyi

通义Token Foundry-产品专家-多模态交互-北京/杭州

社招全职3年以上产品类-平台型地点:杭州状态:招聘

任职要求


1. 3年以上AI交互类产品经验,有智能助手类产品(AI助手/ Agent/Chatbot)成功落地案例。
2. 熟悉多模态技术栈(语音、语义、视觉、对话管理等),了解大模型技术边界,能精准判断技术和场景适配性。
3. 了解交互产品用户体验评测方案,数据集构建与评测方法(如用户意图达成率,链路延迟分布等)。
4. 具备良好的协作与沟通能力,能清晰传达需求和技术愿景,并促进跨部门合作推动产品落地,具备项目…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 多模态交互系统设计:从产品应用体验视角,结合模型的持续迭代进展,定义多模态交互产品架构和标准SDK,主导交互体验优化,包括交互准确性、流畅性、情感化理解和表达、多轮上下文记忆等核心能力。
2. 场景化解决方案开发:
(1)针对不同客户场景,设计交互方案。
(2)协同研发团队针对典型场景,设计并优化模型和工程方案,满足低功耗、高实时性要求。
3. 技术生态整合:
(1)联合外部厂商,推动该交互产品适配。
(2)构建开发者友好的多模态交互套件,降低生态接入成本。
4. 行业洞察与竞争分析:跟踪国内外多模态交互类产品动态,制定技术对标与差异化方案。
包括英文材料
AI agent+
还有更多 •••
相关职位

logo of xiaohongshu
社招引擎

DirectLLM是小红书内部面向各业务场景建设的大模型API服务产品,通过标准化API接口提供LLM/MLLM等大模型推理服务,致力于为AI应用开发者提供品类丰富、数量众多的模型选择,并通过API接口为其提供开箱即用、能力卓越、成本经济的模型服务,各领域模型的能力均可通过统一的API和SDK来实现被不同业务系统集成。 工作职责: 1、参与/负责大模型推理服务平台(MaaS)的架构设计、系统研发、产品研发等工作; 2、深入参与面向大模型场景的请求调度、异构资源调度、引擎优化等核心工作,实现千亿级Token并行推理平台; 3、为内部产品线提供解决方案,协助公司内用户解决大模型应用过程中业务在平台上的使用问题。

北京|上海|深圳
logo of amap
社招4年以上技术类-算法

我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 团队主要聚焦多模态大模型技术在端到端自动驾驶的应用,我们期待你的工作将覆盖以下至少一个技术方向即可: 1. 在端到端自动驾驶、多模态大模型的训练及调优、BEV感知、基于深度学习/强化学习的规划控制、RLHF、驾驶场景视频生成等领域具备丰富且有独创性的研究经历。 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等。 3. 了解大模型模型的训练/微调/推理加速方法,包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理,模型部署加速等。 4. 参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用。 5. 负责收集、整理和分析自动驾驶相关的数据集,进行数据预处理和标注,以提高模型的准确性和泛化能力。 6. 设计和实现端到端自动驾驶模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。

更新于 2025-12-24北京
logo of amap
社招3年以上技术类-算法

我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 团队主要聚焦多模态大模型技术在端到端自动驾驶的应用,我们期待你的工作将覆盖以下至少一个技术方向即可: 1. 在端到端自动驾驶、多模态大模型的训练及调优、BEV感知、基于深度学习/强化学习的规划控制、RLHF、驾驶场景视频生成等领域具备丰富且有独创性的研究经历。 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等。 3. 了解大模型模型的训练/微调/推理加速方法,包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理,模型部署加速等。 4. 参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用。 5. 负责收集、整理和分析自动驾驶相关的数据集,进行数据预处理和标注,以提高模型的准确性和泛化能力。 6. 设计和实现端到端自动驾驶模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。

更新于 2026-03-30北京
logo of baidu
社招ACG

-负责Coding Agent场景的效果优化,深入研究LLM后训练相关技术,包括CPT/SFT/RLHF/RLVR等,提升算法效果和token效率 -构建大规模高质量数据,探索数据飞轮持续提升模型效果的可行性 -跟踪LLM领域的最新研究成果,研究方向包括但不限于中训练、RL后训练、奖励模型设计和创新 -深度参与产品研发和业务落地,和工程/研发/产品等同学密切配合,将优化算法应用于具体业务场景,推动智能体技术的产业化落地

更新于 2025-10-28北京|上海