logo of kuaishou

快手大模型算法工程师(数字人)-【商业化】

社招全职3-5年J0011地点:北京状态:招聘

任职要求


1、本硕博学历均可;计算机、人工智能、数学相关专业;
2、对基于图像、视频、语音、文本等模态内容的各类算法有一定的理解,并在如下一个或多个相关方向有深入研究:GAN 、扩散模型、图像生成、多模态等;
3、具备扎实的编程功底,熟悉Pytorch等主流深度…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、模型研发与微调:负责具体业务场景下大语言模型及多模态大模型的训练与调优,持续提升模型在生成、理解、交互上的表现;
2、多模态生成:了解Diffusion Models、GAN、VAE等生成式技术,解决图像/视频生成的质量、可控性、采样效率及跨模态对齐等核心问题;
3、场景化落地:深入理解业务需求,将大模型能力转化为AIGC创意生成、视频智能化特效、智能对话、代码生成等具体产品方案,实现技术价值闭环;
4、前沿技术跟踪:跟进业界顶尖Paper与开源动态,保持团队技术领先性,通过技术创新解决业务中的极端边界问题。
包括英文材料
学历+
算法+
PyTorch+
深度学习+
还有更多 •••
相关职位

logo of bytedance
社招A80638

团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、负责推荐、搜索相关算法在AI相机场景的研发和落地; 2、支持AI相机相关的业务,推动技术在抖音、剪映等业务线的落地; 3、跟踪业界前沿技术的发展,探索搜索、推荐技术在AI相机场景下的应用。

更新于 2024-03-18上海
logo of pinduoduo
社招技术类

1)负责核心电商搜索、推荐、商业化场景大模型AIGC算法的开发与优化,支持业务场景(如AI交互式对话搜索,智能导购,图文创意生成、数字人等)高效落地; 2)负责大模型Agent、RAG系统全流程研发工作,包括样本标注,数据处理,模型训练(PreTrain、SFT、RL等),Prompt Engineer,WorkFlow设计与开发,评价指标设计; 3)负责Diffusion、Flux等算法在电商图像、视频生成领域的算法优化,追踪前沿技术,持续提升大模型内容生成的质量,赋能业务创新。

更新于 2025-12-22上海
logo of meituan
实习核心本地商业-业

【课题说明】 聚焦多模态数字人核心技术,以直播为应用场景,旨在突破其在真实感、智能交互、情感表达及多模态信息处理上的瓶颈。研发能自主执行复杂运营任务、展现丰富情感与高表现力,并与用户进行深度多模态内容互动的下一代数字人,革新直播行业运营模式与用户体验。 【建议研究方向】 1.智能运营Agent:研究数字人作为智能Agent,在直播前(策划、脚本、货盘)、中(场控、问答、促单)、后(复盘、再创)全流程承担运营职能。重点攻克基于多模态数据的智能决策、任务自动化及人机协同,提升直播运营效能。 2.高表现力数字人生成驱动:探索高真实感、个性化数字人形象(外观、声音、风格)的快速生成与定制。重点研究大模型驱动的、与语音同步且富含细腻情感的表情、口型、动作的实时驱动,增强直播感染力。 3.多模态内容生成和交互:研究理解用户多模态输入(文、语、图、视频)并进行深度互动。探索数字人自主生成动态多模态内容,丰富直播呈现,提升用户参与感。

更新于 2025-05-27北京
logo of pinduoduo
社招3年以上技术类

1.负责核心电商搜索、推荐、商业化场景大模型Agent的开发与优化工作,支持业务场景(如AI交互式对话搜索,智能导购,图文创意生成、数字人等)高效落地; 2.负责大模型Agent、RAG系统全流程研发工作,结合业务需要,与算法团队搭档,推进 AIGC 项目在各个场景落地以及效果的持续优化。 3.设计高并发分布式架构,优化检索-生成链路性能,解决高并发环境下的延迟问题,保障服务高性能和SLA。 4.探索大模型在电商推荐、搜索、广告投放等场景的落地,推进技术、产品、数据的闭环协同。

更新于 2025-12-22上海