快手【留用实习】音视频大模型算法工程师
任职要求
1、硕士及以上学历,专业不限,计算机相关专业优先;
2、在CV/AI相关CCF-A类会议、期刊发表过高质量论文者优先;在各类视觉竞赛、算法竞赛中获得较高名次者优先;
3、熟悉常见的low-level图像处…工作职责
1、参与快手音视频大模型研发,内容包括视频处理大模型/编码大模型。其整体目标是用更少的码率,转出画质更好的视频,从而为用户带来更好的体验,实现压缩即智能; 2、负责点播/直播的处理大模型开发,探索超分等处理大模型算法上限,内容包括网络架构设计和优化,大规模数据处理, Diffusion保真性优化等; 3、负责点播/直播的编码大模型开发,探索AI codec的压缩上限,内容包括压缩网络框架设计和优化,与H.265等传统算法性能评估等; 4、跟踪国内外最新的前沿AI技术,融合处理和编码大模型,为公司研发出下一代基于AI的高效视频转码系统。
1、负责可灵AI音视频联合生成大模型的关键算法研发和优化; 2、负责音视频数据的筛选,清洗和打标工作,为可灵AI音视频联合生成大模型提供数据支持; 3、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 4、推动音视频联合生成技术在可灵及快手各业务场景中的落地,探索新玩法和业务创新。
1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术,将大模型的生成、理解、交互能力在公司核心业务场景应用落地,包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等; 2、负责LLM及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents 、RAG、 function call、system prompts等,探索大模型应用前沿及新兴应用场景; 3、跟踪行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践; 4、了解业务,与公司各技术团队密切配合,能与产品、运营等角色高效沟通需求和目标,发挥自己的主观能动性,设计技术解决方案,培养自己的良好的业务sense和综合素质。
1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术,将大模型的生成、理解、交互能力在公司核心业务场景应用落地,包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等; 2、负责LLM及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents 、RAG、 function call、system prompts等,探索大模型应用前沿及新兴应用场景; 3、跟踪行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践; 4、了解业务,与公司各技术团队密切配合,能与产品、运营等角色高效沟通需求和目标,发挥自己的主观能动性,设计技术解决方案,培养自己的良好的业务sense和综合素质。