优酷优酷-AIGC大模型文本生成算法工程师-北京
任职要求
1、计算机、自动化、数学等相关专业硕士或博士。 2、优秀的理解能力,优秀的逻辑思维,良好的数学基础,较好的机器学习基础;注:我们不要求对传统NLP技术有深厚的知识基础。 3、过硬的语文能力(工作中你将需要阅读和理解大量的大篇幅文字)。 4、两年以上工作经验,优秀者可放宽,至少从事过一年以上自然语言处理相关工作。 5、良好的表达能力。 具备以下条件…
工作职责
优酷目前致力于研发剧作领域的高质量辅助工具。我们深信,剧作内容的生产是大语言模型落地最有可见价值,最有意思,同时也是最有挑战的领域之一。欢迎您加入我们,和我们一起探索,一起成长,一起见证前沿算法在高质量剧作内容生产中将要创造的奇迹,“为好内容,全力以赴”! 职责: 1、了解剧作逻辑,理解创作过程,链接剧作需求及算法原理,设计定义模型任务。 2、设计制定高质量训练数据构造方案,完成数据制备。 3、完成核心模型(大中型)的训练和调优。可以独立完成,也可以与他人合作,如果能指导他人完成则更好。 4、跟进相关领域的学术及落地成果,探索在我们工作中的应用价值。
-AIGC大模型创意文本生成,多模态创意-物料素材组合优选模型 -负责百度商业搜索广告创意优化的策略研发工作,紧跟业界NLP⽂本⽣成技术,解决面向不同应用场景的创意内容文本生成问题 -分析当前策略的不足以技术驱动业务增长,进行效果跟踪、数据分析,并及时优化,挖掘业务和系统空间 -跟踪和探索AIGC方向研究前沿,实现关键技术突破与落地 -对多模态素材进行精准检索,提供最优质的素材
1、负责多模态生成算法研发,如Diffusion Models 、 GAN 、 VAE 、 Autoregressive Models等,包括但不限文本/图像/视频生成,解决生成质量、多样性、可控性、采样效率、可编辑等问题; 2、负责端到端多模态生成式大模型的框架设计、训练与调优,构建基于生成模型的AI系统,推动多模态AIGC在快手各业务场景的产品化落地; 3、负责百亿/千亿参数量的多模态生成大模型研发,实现关键技术突破,并将前沿算法技术转化为创新产品。
1、针对具体任务场景(如语音识别、机器翻译、图像理解、文本生成等),开展深度学习模型的算法设计与创新,探索新型神经网络架构(如Transformer、MoE、扩散模型等),提升模型在复杂环境下的准确性、鲁棒性与泛化能力。负责端到端建模优化,结合上下文理解、对话状态追踪或多模态融合技术,增强系统在连续交互场景中的语义理解与响应能力。构建高质量训练数据体系,设计自动化语料清洗、标注与增强方案,覆盖多语言、多方言、噪声或小样本等挑战性场景,支撑模型持续迭代。 2、参与大规模预训练模型(LLM、VL模型等)的研发与微调,包括指令微调、对齐优化、提示工程及推理加速,提升模型在下游任务中的表现。探索大模型在跨模态理解(图文、音视频)、实时生成、知识推理等场景的应用路径,推动AIGC、智能摘要、自动字幕、翻译等业务的技术升级。研发高效微调技术(LoRA、Adapter等)与模型服务架构,实现大模型在资源受限环境下的灵活部署。 3、推动模型轻量化与推理加速,应用模型压缩、量化、蒸馏、剪枝等技术,提升模型在移动端、边缘设备或云端的运行效率。协同工程团队完成算法模块的高性能集成,优化分布式训练与推理框架,保障系统低时延、高并发与稳定性。支持多平台部署(移动端、PC端、Web端、云服务),参与全链路性能调优与监控体系建设。 4、跟踪人工智能领域最新研究进展(CV/NLP/ASR/TTS/MT等),结合业务需求进行技术预研与原型验证。与产品、数据、工程团队紧密协作,深入理解用户场景,推动AI能力在实际产品中的创新应用。
创作发布算法方向: 1、负责图像编辑、视频剪辑、文案创作等内容创作相关算法的研发与优化,并在社区发布、商业化&电商创作等场景落地; 2、跟进多模态大模型内容生产、Agent等相关技术的最新发展趋势,保持技术先进性,持续探索Agent在内容创作方面的潜力。 内容理解方向: 1、负责多模态内容理解、图像理解以及NLP相关的算法研发工作,提升搜索、广告、推荐、创作发布的效果和体验; 2、负责包括但不限于多模态大模型Pre/PostTrain、数据挖掘,持续优化并突破业界SOTA效果,兼具落地以获取业务线上收益; 3、紧密关注相关领域业界的最新进展,时刻保持技术先进性,探索前沿技术的落地结合点。 AIGC生成方向: 1、负责多模态生成/GAN/Diffusion等图像&视频生成相关算法研发与优化, 跟进该领域的前沿技术研究; 2、参与技术规划制定, 跟进图像&视频生成技术最新发展趋势,打造业内领先的多模态内容生成能力。; 3、推动技术在图像&视频编辑/素材生成/辅助设计/特效等领域的应用。