同花顺数字人算法工程师（多模态交互）

校招全职AI 算法类地点：杭州状态：招聘

扫码手机上打开

任职要求

硕士及以上学历，计算机视觉、图形学、机器人或人工智能相关专业；
精通 Python、C++ 等编程语言，熟悉主流深度学习框架（如 PyTorch、TensorFlow 等）；
对大模型的底层原理和应用有较为深入的理解；有实际应用经…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

负责研发虚拟数字人多模态交互算法，整合语音、文本、表情、肢体动作等多模态信息，实现自然流畅的人机交互；
持续优化多模态交互算法，提升数字人对复杂多模态输入的理解与处理能力，增强交互的精准性和实时性；
探索端到端的数字人多模态交互技术；
跟踪人工智能领域的前沿技术在虚拟数字人项目的应用和落地。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

OpenCV+

Python+

C+++

深度学习+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

算法工程师-语音多模态大模型

实习淘天集团2026

如果你，期望参与淘天集团语音多模态大模型技术研发，推动数字人AI智能对话、语音自然交互等技术在淘宝Vision和手机淘宝等亿级用户场景的产品化落地；如果你，期望突破语音模态与语言模型的融合边界，构建新一代Speech-to-Speech多模态基座模型，持续跟踪大模型领域国际前沿技术，通过产学研合作打造行业领先的对话交互系统；如果你，期待与顶尖算法团队并肩作战，在开放创新的技术氛围中与自驱力强、专业过硬、追求极致的技术伙伴共同开拓多模态交互新范式；那还在等待什么，赶紧加入我们吧！

更新于 2025-05-07杭州

【北斗实习】大模型应用算法工程师-【多模态数字人】

实习核心本地商业-业

【课题说明】聚焦多模态数字人核心技术，以直播为应用场景，旨在突破其在真实感、智能交互、情感表达及多模态信息处理上的瓶颈。研发能自主执行复杂运营任务、展现丰富情感与高表现力，并与用户进行深度多模态内容互动的下一代数字人，革新直播行业运营模式与用户体验。【建议研究方向】 1.智能运营Agent：研究数字人作为智能Agent，在直播前（策划、脚本、货盘）、中（场控、问答、促单）、后（复盘、再创）全流程承担运营职能。重点攻克基于多模态数据的智能决策、任务自动化及人机协同，提升直播运营效能。 2.高表现力数字人生成驱动：探索高真实感、个性化数字人形象（外观、声音、风格）的快速生成与定制。重点研究大模型驱动的、与语音同步且富含细腻情感的表情、口型、动作的实时驱动，增强直播感染力。 3.多模态内容生成和交互：研究理解用户多模态输入（文、语、图、视频）并进行深度互动。探索数字人自主生成动态多模态内容，丰富直播呈现，提升用户参与感。

更新于 2025-05-27北京

【北斗】大模型算法工程师（服务零售）

校招核心本地商业-业

以大模型对话技术为核心，探索前沿技术问题，研究方向主要为垂域模型的研究与构建。目标是为用户提供专属的玩乐变美便捷生活小助手，实现“技术驱动业务范式”的升级转变，最终助力商业价值全面提升。研究方向一：Agent能力增强基于Agent的用户助理，研究提升Agent自主规划能力，并通过Agent构建和基于后训练的优化，实现数字助理的能力复刻和增强。研究方向二：强化学习算法研究参与大语言模型后训练阶段的强化学习算法研究，包括基于AI和环境反馈的强化学习（RLXF）算法。同时探索奖励模型与反馈机制，研究可泛化的细粒度过程监督和奖励建模，探索基于细粒度反馈的强化学习算法。研究方向三：垂域模型定制化构建领域认知智能突破，探索小样本场景自演进架构设计、可信推理机制构建等方向，同时建立面向AGI的模型评价体系新范式。研究方向四：精准上下文理解与长程依赖建模研究如何高效、准确地捕获和利用复杂的项目级上下文信息（如整个代码库、依赖关系、API文档、Issue跟踪等），探索能够处理超长代码序列、理解跨文件依赖和项目架构的先进模型结构与表征方法，以支持更精准、更全局的代码智能，从而提升业务研发在存量代码中迭代的效率。

更新于 2025-05-23北京|上海

【北斗】大模型算法研究员（RL/推理/RAG/多模态技术）

校招核心本地商业-业

研究方向一：垂域LLM研究与构建 1.基座模型架构设计与优化：参与大语言模型基座架构的设计，研究前沿技术，如稀疏激活、混合精度训练等，同时优化模型的训练和推理流程。 2.技术创新与突破：参与前沿技术研究，如多任务学习、跨模态理解等，推动模型在复杂任务上的性能提升；探索Transformer替代架构，突破现有模型scaling law限制；同时挑战学术benchmark，为模型的性能树立新的行业标杆。 3.强化学习算法研究：参与大语言模型后训练阶段的强化学习算法研究，包括基于AI和环境反馈的强化学习（RLXF）算法。同时探索奖励模型与反馈机制，研究可泛化的细粒度过程监督和奖励建模，探索基于细粒度反馈的强化学习算法。 4.垂域模型定制化构建：领域认知智能突破，探索小样本场景自演进架构设计、可信推理机制构建等方向，同时建立面向AGI的模型评价体系新范式。 5.跨部门协作与落地：与公司数据科学家、算法工程师、产品团队紧密合作，将研究成果快速转化为实际应用，推动大语言模型在更多场景的落地。研究方向二：垂域MLLM研究与构建 1.研究多模态表征与大语言模型融合的前沿技术，设计和实现创新算法，研究异质数据的统一编解码模型，适配多种模态下的特征统一，实现高效微调与优化。 2.探索强化学习（RL）在多模态大模型中的应用，包括强化学习增强的多模态生成、跨模态对齐、偏好建模及自适应优化，提升多模态理解与推理能力。 3.持续追踪多模态与强化学习结合的最新研究进展，优化现有多模态系统架构，提升性能、效率与可扩展性，推动多模态强化学习在智能体交互、决策推理等任务中的应用。 4.构建技术评估体系，通过多场景验证推动多模态理解、生成及强化学习优化策略的落地应用，提升多模态大模型的泛化能力和实际应用价值。研究方向三：基于角色扮演的虚拟数字助理 1. 角色扮演技术（Role-Playing）：通过模型优化、Agent构建，在人设、拟人性、情感等取得显著提升。 2. 记忆管理与增强（Memory）：通过模型长上下文，记忆抽取与管理，提升系统的记忆能力。 3. 个性化技术：通过用户行为数据挖掘与建模，结合多轮对话上下文理解，分析用户情感状态，提升模型的个性化回复能力。 4. 基于Agent的数字助理：通过Agent构建和基于RL的优化，实现数字助理的能力复刻和增强

更新于 2025-05-23北京