logo of liauto

理想汽车【智能空间】大模型算法专家-音频

社招全职智能与信息技术地点:北京状态:招聘

任职要求


1. 音频信号处理、语音信号处理、机器学习等相关专业硕士、博士毕业生;
2. 熟悉传统机器学习基础理论,熟练掌握Kaldi、TensorFlowPytorch等社区开源工具中的一种及以上;
3. 熟练C/C++PythonShell编程语言,对数据结构和算法设计有深刻理解,参加过ACM等编程比赛的优先;
4. 参与过回声消除、声学定位、语音分离、语音增强、语音识别、唇语识别、手写识…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责音频、语音等算法的处理和实现;
2. 负责智能座舱内语音分离与增强、语音唤醒、语音识别算法的研发和落地;
3. 负责多模态融合算法、多模态大语言模型的研发与落地。
包括英文材料
机器学习+
TensorFlow+
PyTorch+
C+
C+++
Python+
Bash+
还有更多 •••
相关职位

logo of taptap
社招技术大类

1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。

更新于 2025-08-15上海
logo of xd
社招技术大类

1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。

更新于 2025-12-10上海
logo of didi
社招技术

1.负责多模态大模型全链路研发与优化,涵盖 SFT、RL 训练等关键环节,探索图文、视频、音频等多模态数据的质量评估与清洗方法、优化模型训练策略及结构设计、提升模型泛化与推理能力。 2.结合业务场景需求,主导多模态大模型落地项目,涵盖内容理解与结构化、质量甄别、智能生成等任务,设计算法方案并推动上线,提升业务效率与用户体验。 3.跟踪多模态大模型前沿技术,探索其在安全治理场景的适配性和落地,驱动技术迭代。 4.承担团队管理与人才培养,提升团队技术影响力。

更新于 2026-02-24北京
logo of antgroup
社招5年以上技术类-算法

为应对日益复杂的金融欺诈手段和动态变化的信用风险环境,我们正在全面推进风险管理智能化升级。现诚邀一位具备前沿AI技术视野与实战能力的 AI创新算法专家 加入我们的核心团队,主导基于大语言模型(LLM)、多模态大模型等新一代人工智能技术的风险链路重构项目。 你将作为AI技术创新的引领者,推动从传统规则驱动向“感知-推理-决策”一体化智能风控体系的演进,构建覆盖贷前、贷中、贷后及支付全链路的下一代智能风控架构,显著提升风险识别精度、响应速度与自动化水平。 主要职责 1,主导AI驱动的风险链路重构项目:设计并落地基于LLM与多模态大模型(文本、图像、音频、行为序列等)的端到端风险识别系统,重构现有反欺诈、信用评估与支付风控流程。 2,构建智能风险理解引擎:利用大模型对非结构化数据(如客户沟通记录、社交信息、交易描述、证件图像、视频认证等)进行深度语义理解与关联分析,挖掘潜在风险信号。 3,开发自适应风险推理框架:结合知识图谱、因果推断与大模型的推理能力,实现对复杂欺诈模式(如团伙欺诈、身份冒用、场景伪装)的自动归因与可解释性输出。 4,探索多模态融合建模:整合文本、图像、生物特征、设备指纹、行为时序等多源异构数据,构建统一表征空间,提升高隐蔽性风险的检出率。 5,推动AI能力产品化与工程落地:与工程、数据平台及业务团队协作,完成模型部署、A/B测试、性能监控与持续迭代,确保在高并发、低延迟场景下的稳定运行。 6,跟踪前沿技术动态:持续关注大模型、Agent智能体、RAG、Prompt Engineering、小样本学习等技术在金融风控中的应用进展,推动技术预研与创新试点。 7,建立AI风控伦理与合规框架:确保模型设计符合数据隐私、公平性与监管要求,规避偏见与滥用风险。

更新于 2026-03-31杭州