蚂蚁金服蚂蚁集团-AGI原生应用-AIGC算法专家
任职要求
1. 具备扎实的大模型研发经验,深入理解DiT、Self-Forcing、RL算法、DMD蒸馏加速相关算法原理。有图像生成、视频生成或3D生成经验; 2. 熟悉AIGC应用数据准备的全流程,包括数据采集、清洗、标注等,对于如何人工合成高…
工作职责
1.面向AGI创新产品,探索内容生成和创新互动模式。通过内容生成(图像/视频/3D),为用户打造全新的内容体验和交互模式。 3. 结合产品场景,进行文生图、图像编辑、视频生成、3D生成模型的研究优化,解决生产质量、可控性、生成效率等关键问题。 3. 基于SOTA基模,进行Continue Pretrain/SFT/RL相关的优化,评测模型能力,探索各种下游应用场景。 4.追踪领域前沿工作,包括但不限于实时视频生成、世界模型等方向,探索RLHF在视觉生成领域的scaling law等。
【团队介绍】 小红书技术中台AI应用算法团队专注于图文、视频等场景下的大语言模型、多模态模型、扩散模型等技术的落地应用,通过标准化的AI技术能力支持公司各业务团队,提升技术资源利用率和业务创新迭代速度,持续优化技术研发成本并提升大规模AI应用的系统稳定性。团队兼具活跃的技术氛围、一线业务的真实挑战和相对充足的计算资源,欢迎有志于AGI、AIGC等方向的同学加入。 1、跟踪大语言模型、多模态、强化学习等算法的最前沿进展,将相应技术赋能到小红书实际的业务场景中,包括社区,商业化,交易等,持续推动AGI在业务场景下的落地应用; 2、基于成熟的AI平台服务,构建完善的AI原生应用和X+AI应用,包括如智能助理、知识问答、深度研究等,打造具有核心用户价值的热点应用; 3、探索大语言模型、多模态模型、扩散模型等在搜广推场景的落地方案。
【团队介绍】 小红书技术中台AI应用算法团队专注于图文、视频等场景下的大语言模型、多模态模型、扩散模型等技术的落地应用,通过标准化的AI技术能力支持公司各业务团队,提升技术资源利用率和业务创新迭代速度,持续优化技术研发成本并提升大规模AI应用的系统稳定性。团队兼具活跃的技术氛围、一线业务的真实挑战和相对充足的计算资源,欢迎有志于AGI、AIGC等方向的同学加入。 1、跟踪大语言模型、多模态、强化学习等算法的最前沿进展,将相应技术赋能到小红书实际的业务场景中,包括社区,商业化,交易等,持续推动AGI在业务场景下的落地应用; 2、基于成熟的AI平台服务,构建完善的AI原生应用和X+AI应用,包括如智能助理、知识问答、深度研究等,打造具有核心用户价值的热点应用; 3、探索大语言模型、多模态模型、扩散模型等在搜广推场景的落地方案。
小红书的AI技术中台目前由ai技术部负责建设,通过标准化的AI技术能力提供支持公司各个业务团队,实现AI能力的共享和复用,提升技术资源的利用率和公司的创新迭代速度,并降低技术成本和稳定性风险 1、跟踪前沿AI算法进展,并将相应技术赋能到小红书实际的业务场景中,包括社区,商业化,交易,agi等 2、在AI平台之上构建应用层,可接触到大模型各种可能的落地场景,如知识问答,智能助理(AI取数、智能客服等场景),大模型工具(SFT)等 3、探索大模型技术在搜广推场景的落地方案
在算力驱动的 AGI 和人文精神的烟火气交汇之处,我们真诚邀请对大模型 Omni Model 有热情的同学加入,共同打造更具影响力的智能系统。你会成为团队的一员,并和其他同事协作,共同研发 SOTA 的 Omni Model。期待你以务实和客观的科学态度来推进技术的进展,不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态。 区别于传统 ASR / TTS 级联技术,我们希望打造端到端的 Omni Model 在实时交互中释放大模型的智力水平,彻底改变以 Chatbot 文字为主的人机交互界面 岗位说明:你会负责围绕大模型 Omni Model 构建语音模态的相关研究工作,包括但不限于如下事项 海量的语音数据处理和构建:定性分析、定量评估数据质量,并给出 scalable 的改进方案;探索跨模态(文字/视觉/语音)混合训练的最佳实践; 探索更加高效且合理的模型架构,让模型更加理解音频,同时让模型具备更好的语音合成能力 研究并探索基于 Omni Model 的 Post Train,包含但不限于 SFT 和 RL