快手大模型算法工程师（数字人）-【商业化】

社招全职3-5年J00112026-02-10地点：北京状态：招聘

扫码手机上打开

任职要求

1、本硕博学历均可；计算机、人工智能、数学相关专业；
2、对基于图像、视频、语音、文本等模态内容的各类算法有一定的理解，并在如下一个或多个相关方向有深入研究：GAN 、扩散模型、图像生成、多模态等；
3、具备扎实的编程功底，熟悉Pytorch等主流深度…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、模型研发与微调：负责具体业务场景下大语言模型及多模态大模型的训练与调优，持续提升模型在生成、理解、交互上的表现；
2、多模态生成：了解Diffusion Models、GAN、VAE等生成式技术，解决图像/视频生成的质量、可控性、采样效率及跨模态对齐等核心问题；
3、场景化落地：深入理解业务需求，将大模型能力转化为AIGC创意生成、视频智能化特效、智能对话、代码生成等具体产品方案，实现技术价值闭环；
4、前沿技术跟踪：跟进业界顶尖Paper与开源动态，保持团队技术领先性，通过技术创新解决业务中的极端边界问题。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

算法+

PyTorch+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

多模态推荐算法工程师-智能创作（北京/上海）

社招A80638

团队介绍：智能创作团队是字节跳动的创作场景业务中台，以AI赋能创造，致力于通过AI技术降低创作门槛，赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线，持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景，通过由AI驱动的智能化工具与算法，为用户提供了更智能、更便捷、更丰富的创作体验，助力普通用户轻松实现高质量内容创作，同时为专业创作者提供强大的技术支持，推动内容生态的繁荣与创新。 1、负责推荐、搜索相关算法在AI相机场景的研发和落地； 2、支持AI相机相关的业务，推动技术在抖音、剪映等业务线的落地； 3、跟踪业界前沿技术的发展，探索搜索、推荐技术在AI相机场景下的应用。

更新于 2024-03-18上海

【商业化】大模型应用算法工程师

社招技术类

1）负责核心电商搜索、推荐、商业化场景大模型AIGC算法的开发与优化，支持业务场景(如AI交互式对话搜索，智能导购，图文创意生成、数字人等)高效落地； 2）负责大模型Agent、RAG系统全流程研发工作，包括样本标注，数据处理，模型训练(PreTrain、SFT、RL等)，Prompt Engineer，WorkFlow设计与开发，评价指标设计； 3）负责Diffusion、Flux等算法在电商图像、视频生成领域的算法优化，追踪前沿技术，持续提升大模型内容生成的质量，赋能业务创新。

更新于 2025-12-22上海

【北斗实习】大模型应用算法工程师-【多模态数字人】

实习核心本地商业-业

【课题说明】聚焦多模态数字人核心技术，以直播为应用场景，旨在突破其在真实感、智能交互、情感表达及多模态信息处理上的瓶颈。研发能自主执行复杂运营任务、展现丰富情感与高表现力，并与用户进行深度多模态内容互动的下一代数字人，革新直播行业运营模式与用户体验。【建议研究方向】 1.智能运营Agent：研究数字人作为智能Agent，在直播前（策划、脚本、货盘）、中（场控、问答、促单）、后（复盘、再创）全流程承担运营职能。重点攻克基于多模态数据的智能决策、任务自动化及人机协同，提升直播运营效能。 2.高表现力数字人生成驱动：探索高真实感、个性化数字人形象（外观、声音、风格）的快速生成与定制。重点研究大模型驱动的、与语音同步且富含细腻情感的表情、口型、动作的实时驱动，增强直播感染力。 3.多模态内容生成和交互：研究理解用户多模态输入（文、语、图、视频）并进行深度互动。探索数字人自主生成动态多模态内容，丰富直播呈现，提升用户参与感。

更新于 2025-05-27北京

【商业化】大模型应用开发工程师

社招3年以上技术类

1.负责核心电商搜索、推荐、商业化场景大模型Agent的开发与优化工作，支持业务场景(如AI交互式对话搜索，智能导购，图文创意生成、数字人等)高效落地； 2.负责大模型Agent、RAG系统全流程研发工作，结合业务需要，与算法团队搭档，推进 AIGC 项目在各个场景落地以及效果的持续优化。 3.设计高并发分布式架构，优化检索-生成链路性能，解决高并发环境下的延迟问题，保障服务高性能和SLA。 4.探索大模型在电商推荐、搜索、广告投放等场景的落地，推进技术、产品、数据的闭环协同。

更新于 2025-12-22上海