
三七互娱AI算法工程师(大模型/AIGC方向)
任职要求
1.本科及以上学历,熟练掌握深度学习、机器学习、自然语言处理、强化学习、生成模型等至少一个领域的基础知识; 2.熟悉TensorFlow或PyTorch深度学习框架,精通C/C++、Java、Python等至少一门编程语言,具备一定的工程实现能力; 3…
工作职责
1. 负责主流AIGC算法业务的调研和落地推进,包括但不限于智能客服、智能创作、Text2Code、角色扮演等; 2. 探索Prompt Engineering、In-Context Learing、Multi-Agent、模型Finetuning等技术的业务落地,优化算法的效果和产品体验; 3. 通过图文音视频等多模态生成模型的研究优化,解决目前AI在生成质量、多样性、可控性、生成效率等方面的问题,提升AI生产效能。
岗位职责: 1.进行大模型、多模态大模型、AIGC模型、自驾模型等多个方向端侧加速优化算法的研发与探索 2.工作内容包括但不限于上述模型的训练调优、量化、剪枝、小型化、稀疏优化、投机推理、专用加速、结构搜索(NAS)等 3.与芯片团队配合针对相关加速特性进行芯片算法联合设计与优化,并提供针对自研芯片的完整算法加速解决方案 4.帮助客户在自研芯片上进行算法加速优化的模型加速优化训练及交付
1、大模型研发与微调:负责面向小说创作场景的大语言模型(LLM)SFT及RLHF;针对文学创作特性,优化模型在中长文本生成、剧情逻辑连贯性及文风模仿上的表现; 2、场景化应用落地:深入理解网文/出版业务流,将大模型能力转化为辅助写作、自动续写、剧情大纲生成、多分支互动小说等具体产品功能,构建从灵感到小说正文的AIGC生产管线; 3、长文本与一致性控制:攻克长上下文理解与生成的技术难点,利用记忆机制、知识图谱或Agent架构,解决小说创作中人物设定、世界观、剧情伏笔的长期一致性问题; 4、评估体系与前沿探索:跟进业界最新的LLM架构(如MoE、Attention优化)及Agent技术,通过技术创新提升内容生产效率和质量。
1、模型训练: 研究并应用先进大模型训练技术(如SFT、RL、Post-training等), 构建面向生服场景的垂类大模型; 2、Agent化:负责内容生成的pipeline和agent构建,提升AIGC产线的泛化性水平和转化效率,最终实现对优秀人类作品的端到端学习和拟人化对标; 3、数据驱动优化:基于业务数据统计和挖掘,发现当前系统问题和待提升方面,进而制定优化计划; 4、行业对标:紧跟基模和行业产品发展趋势,推动新模型的产品化落地。
1、负责AIGC模型如StableDiffusion/LLM/VLM的轻量化结构设计和效果打磨,致力于研发效果/体积/计算量/功耗综合性能业界领先的预训练模型; 2、负责AIGC模型相关推理优化算法研究和落地,包括模型蒸馏、网络架构搜索与设计、稀疏、量化、MoE,软硬件协同设计等; 3、负责Diffusion/LLM/VLM领域高效模型研发,低成本微调,小样本训练,Prompt工程,RLHF研究和实现,侧重能够端侧部署的模型; 4、负责GAN/Diffusion/LLM/VLM领域前沿工作的研究和复现,包含数据,模型,评估,推理等方向; 5、负责面向端侧多个平台的GAN基础结构设计和效果优化,重点解决GAN的量化效果问题,落地抖音剪映等字节跳动系列产品,全面提升产品在多个平台上的算法和性能体验。