字节跳动多模态大模型算法工程师-智能创作
任职要求
1、本科及以上学历,计算机相关专业;
2、1年以上AutoML、模型优化或AI相关工作经验;
3、积极主动有热情,能与团队融洽合作相处,具备较强的沟通能力;
4、有StableDiffusion,LLM,VL…工作职责
1、负责AIGC模型如StableDiffusion/LLM/VLM的轻量化结构设计和效果打磨,致力于研发效果/体积/计算量/功耗综合性能业界领先的预训练模型; 2、负责AIGC模型相关推理优化算法研究和落地,包括模型蒸馏、网络架构搜索与设计、稀疏、量化、MoE,软硬件协同设计等; 3、负责Diffusion/LLM/VLM领域高效模型研发,低成本微调,小样本训练,Prompt工程,RLHF研究和实现,侧重能够端侧部署的模型; 4、负责GAN/Diffusion/LLM/VLM领域前沿工作的研究和复现,包含数据,模型,评估,推理等方向; 5、负责面向端侧多个平台的GAN基础结构设计和效果优化,重点解决GAN的量化效果问题,落地抖音剪映等字节跳动系列产品,全面提升产品在多个平台上的算法和性能体验。
1、负责音乐相关业务的大语言模型的研发和应用,相关研发技术和解决方案在抖音、汽水音乐等产品中应用,满足音乐相关业务场景中的用户不断增长的智能交互需求,全面提升用户在音乐相关的创作和消费场景的体验; 2、参与音乐相关大模型的研发,如音乐预训练、音乐多模态模型等; 3、参与大模型技术在音乐场景中的探索和相关应用落地,如音乐搜推、音乐助手、视频配乐等; 4、在音乐人工智能领域开展前沿研究,在未来生活中的更多音乐相关的使用场景的深入研究和探索。
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、团队负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式;主要工作方向包括: 1)优化&创新RLHF算法训练效率与模型泛化能力; 2)Long CoT技术的实现和应用; 3)多模态大模型(文本、图像、语音)的Posttraining算法; 4)构建高质量、多领域的数据合成方法; 5)探索LLM在情感对话、创作等场景的应用。
1. 负责AI技术在游戏场景内的应用,例如智能NPC、游戏AI玩法、剧本创作等。 2. 和上下游保持较好的沟通和协作,确保项目的推进和上线。 3. 具备较强的自驱力,追踪前沿的大模型相关技术,并思考和探索AI技术和游戏的结合点。