哈啰云端基础模型算法工程师/专家

社招全职算法2026-02-03地点：杭州 | 上海状态：招聘

扫码手机上打开

任职要求

1. 基础背景：计算机/数学/机器人等相关专业硕士及以上；精通 Python及 PyTorch，具备极致的代码与工程能力。
2. 核心要求：熟悉深度神经网络，精通多模态融合、深度估计、…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 时序、多模态融合算法，设计与改进点云、图像多模态融合方案，时序融合方案，提升场景表征能力，进而提升感知等任务性能。
2. 视觉基础模型预训练，设计与改进自监督代理任务，通过大规模预训练提供更优秀的基础模型，提升感知等任务性能。
3. 自动驾驶领域的VLM基础模型，设计具备3D感知能力的视觉token，对齐文本指令，大规模预训练自动驾驶领域的VLM专用模型。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Python+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

智驾算法工程师/专家（VLA.VLM方向）-【自动驾驶】

社招算法

工作职责： 1. 基于Vision Language Model（VLM）和Large Language Model（LLM），设计和实现自动驾驶中面向行为预测和运动规划的基座模型； 2. 参与基座模型的预训练、后训练（SFT + RL），提升基座模型的行为预测和运动规划能力； 3. 针对车端/云端部署，开展模型算法层面的性能优化工作，例如压缩，剪枝，蒸馏，训练/推理加速等，确保模型可用性、系统实时性和资源利用率； 4. 与硬件团队、部署团队和系统团队紧密协作，推动模型部署，以及在仿真和车载平台的落地； 5. 跟踪行业前沿技术，将创新性方案应用于实际项目，推动新技术在产品中的落地。

更新于 2025-12-03北京|广州|上海

AI算法专家

社招研发类

候选人符合以下两种

杭州

钉钉-语音算法-工程师/专家

社招1年以上技术类-算法

语音是人机交互中最自然、最便捷的模态。随着大模型时代的到来，语音AI的研究正从单一任务向多模态、高自然度交互演进。在阿里巴巴，我们的语音技术已深度植入流媒体、直播互动、智能客服、办公会议、AIoT及数字人等多元场景。我们正在寻找志同道合的伙伴，共同探索语音技术在复杂场景下的极限。在这里，你不仅能触达海量的真实数据，更能亲手打造影响亿万用户的交互体验。一段更具挑战、更有成就感的旅程正待开启！岗位职责： 1. 核心算法研发：负责语音信号处理领域的前沿算法研究与落地，包括但不限于语音识别（ASR）、语音合成（TTS）、说话人识别与分离（Speaker Verification/Diarization）、语音增强及端到端语音交互方案； 2. 专项技术突破： ● 声纹与属性识别：负责声纹识别、语种识别以及情绪识别（Emotion Recognition）的算法优化，提升在真实业务场景下的识别精度与跨域泛化能力； ● 音频内容理解：基于语义与声学特征，深度挖掘语音中的情感、意图及环境信息，赋能直播审核、内容分析等业务； ● AI-VAD：研发基于深度学习的高鲁棒性语音活动检测（VAD）算法，解决强噪声、多语者叠加、远场等复杂环境下的起停点检测痛点； 3. 模型工程化落地：推动算法在云端或端侧的部署优化，在保障性能（精度/鲁棒性）的同时，平衡算力消耗与推理延迟； 4. 技术预研：跟踪并探索语音领域前沿技术（如大语言模型与语音的结合、Speech-to-Speech原生端到端交互等）。

更新于 2026-06-05杭州

自动驾驶闭环仿真工程师/专家

社招5-7年数字技术

负责端到端大模型闭环仿真相关的3D场景重建算法应用和自研仿真引擎开发，并落地于自动驾驶闭环仿真业务基于三维重建算法和游戏引擎提升3D仿真动静态场景渲染真实度和效率，交付高逼真度的虚拟仿真3D场景和资产开发产品级的端到端虚拟仿真引擎，提升交通流智能体真实度，提升闭环仿真各系统模块运行效率，减少云端部署和运行成本调研自动驾驶仿真相关的前沿算法和技术，突破现有仿真工具的功能瓶颈

更新于 2025-01-03北京