字节跳动NLP算法工程师-抖音对话机器人
任职要求
1、具有扎实的机器学习基础,对传统NLP技术、GPT类技术有深入的理解,数理功底扎实,自学能力强; 2、有扎实的编码能力,熟练使用相关机器学习框架和工程框架; 3、在多模态大模型领域有经验,在短视频、图文算法领…
工作职责
负责抖音对话机器人场景中NLP技术的研发与应用,研究包括传统NLP技术、LLM技术在聊天机器人领域基础技术支持和落地应用。主要工作方向包括: 1、负责对客服、角色化对话机器人算法方向的通用NLP基础能力建设,包括但不限于数据建设、模型训练推理框架迭代、维护模型评估指标体系、建设通用NLP模型; 2、支持LLM、MLLM方向的新技术研究和落地应用,支持指令微调、强化学习相关算法需求; 3、建设基于LLM/MLLM技术的新一代的智能客服机器人,探索建设数字人技术在抖音落地应用。
岗位职责: 1、负责 AI Agent 系统的设计、开发和优化、开发和完善基于大语言模型 (LLM) 的智能体系统,提升 Agent 的自主决策和任务执行能力; 2、负责生成式大模型指令意图理解相关工作,整体提升大模型的多轮对话指令理解能力和性能; 3、设计并实现 Agent 的工具使用接口,实现与各类外部系统和 API 的集成编排; 4、负责大模型在检索、推荐方面的系统设计实现和优化,探索Agent、RAG、领域模型调优等相关技术在业务场景落地; 5、具备模型知识、幻觉机制探究,提升模型知识水平、降低模型幻觉率; 6、能够基于开源模型,设计和开发算法,对模型进行微调,优化其参数和结构,以提高模型的泛化能力和准确性; 7、深入调研AI领域相关的前沿技术,跟踪业内大模型领域的最新进展,并寻求将最新技术应用到产品的可能性。
负责快手搜索系统的业务引擎架构方向,面向短视频、电商、本地、搜索增长等多业务场景构建大规模业务引擎,支持算法业务的高效迭代。具体职责包括: 1、构建面向各个搜索业务的全链路业务引擎模块,包括策略服务、统一特征服务,排序服务等,支持算法和产运的迭代需求; 2、构建面向在线引擎的全图化引擎架构,提升全链路算法迭代效率和系统优化效率; 3、构建在线混部,动态算力等技术在高可用基础上提升在线引擎算力供给; 4、探索AI智能搜索、AI对话等新业务,探索大模型在搜索的应用落地。
优酷目前致力于研发剧作领域的高质量辅助工具。我们深信,剧作内容的生产是大语言模型落地最有可见价值,最有意思,同时也是最有挑战的领域之一。欢迎您加入我们,和我们一起探索,一起成长,一起见证前沿算法在高质量剧作内容生产中将要创造的奇迹,“为好内容,全力以赴”! 1、了解剧作逻辑,理解创作过程,链接剧作需求及算法原理,设计定义模型任务 2、设计制定高质量训练数据构造方案,完成数据制备 3、完成核心模型(大中型)的训练和调优。可以独立完成,也可以与他人合作,如果能指导他人完成则更好 4、跟进相关领域的学术及落地成果,探索在我们工作中的应用价值
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、团队负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式;主要工作方向包括: 1)优化&创新RLHF算法训练效率与模型泛化能力; 2)Long CoT技术的实现和应用; 3)多模态大模型(文本、图像、语音)的Posttraining算法; 4)构建高质量、多领域的数据合成方法; 5)探索LLM在情感对话、创作等场景的应用。