小红书多模态算法工程师(广告&营销)-社区技术
任职要求
1、在多模态大模型方向有一定经验,对Pre-train、SFT等技术有深入了解; 2、对图片/视频的理解、搜索、召回、排序、推荐等技术有直接的算法经验; 3、有扎实的编程基础、良好的编程风格和工作习惯,熟悉Python/C++/SQL; 4、对技术有热情,有良好的沟通表达能力和团队精神,自驱力强; 5、对外投广告、搜索广告、电商…
工作职责
优化自动化素材生产平台的算法能力,拆解起量创意进行创意洞察,视频智能剪辑,内容优选,并以数据驱动的方式,优化素材投前、投中环节的效果,帮助业务高效达成拉新&拉活&提收&变现、业务渗透等增长目标。 1、利用CV、NLP、 Graph等多模态理解能力,对小红书图文/视频数据进行标签召回&向量召回,提供多维度的图像/视频审核&打标能力,搭建可以快速响应需求的标签&召回冷启能力,为广告业务提供更加优质和精准的素材内容,提高素材产能 2、基于大规模多模态模型对小红书视频素材进行分析理解,包括但不限于场景识别、动作识别、视频高光时刻检测、视频封面等,用以提升视频片段和封面的质量,提高素材质量 3、结合平台信息、用户信息、不同维度的素材内容搭建多模态的LTR/CTR模型,对生成的广告进行视频质量预估、投前转化预估,提高广告的拉新效率和爆款率 4、探索大模型(LLM、多模态)的高效 finetuning技术和推理技术,保证大模型在业务场景中的快速适配和高效调用; 5、负责对各业务场景下的技术问题和业务表现进行分析、溯因、算法设计、研发以及部署上线
团队介绍: 高德地图机器学习研发部是公司AI核心技术引擎,聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地,支撑亿级用户产品,同时长期投入前沿探索,在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文,多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源,鼓励创新突破,诚邀你与顶尖算法专家并肩,共同定义AI的未来!如果你渴望挑战多模态与生成式AI的技术巅峰,在视频、图像、大模型的交叉领域实现突破,欢迎加入我们!团队的github页面是:https://github.com/AMAP-ML/ 我们提供 • 参与亿级用户产品的AI核心算法研发,见证技术直接赋能业务; • 与学术大牛和工业界专家共事,持续提升技术视野; • 顶配算力资源+开放创新氛围,支持前沿探索与顶会论文发表。 具体职责包括但不限于: 1. 视频生成:负责视频生成技术的前沿技术的研究,对AIGC的diffusion和auto-regressive技术有深入了解,在T2I/AIGCT2V/I2V上面有一定的研究,图文对齐,长视频生成等有一定的研究,做好视频生成在高德业务(广告,POI详情页等)中的进行落地。 2. 视频理解:能够使用和优化多模态大模型对用户上传的视频进行质量理解,标签,densecaption,视频summary等生成,作用到视频的搜索,广告,推荐等业务的落地。 3. 世界模型: 参与世界模型的构建,能够使用最新的视频生成技术,3D技术等构建符合人类物理规律的统一的世界模型,在高德的业务进行落地。 4. 紧跟技术前沿和技术沉淀,形成顶会论文和专利。
业务介绍: 我们是阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。 岗位描述: 1、负责支持业务迭代:推进来自搜索、推荐、广告、用增各域的产品需求快速落地。 2、负责系统架构设计:负责搜索、推荐、广告引擎的架构设计与优化,支撑多语言场景下的高并发请求处理,满足全球用户低延迟、高可用的服务需求。 3、负责性能调优:针对召回排序、模型训练&推理、特征计算等模块进行工程性能优化(如分布式计算加速、内存管理、GPU资源调度等),提升算法迭代效率。 4、负责工程平台开发:构建算法与工程协同的标准化平台,包括特征实时化平台、在线推理服务框架、AB实验平台等,支持算法快速迭代与业务效果验证。 5、负责大模型工程优化:负责生成式AI技术的工程落地,包含大模型训练、推理加速、多模态内容生成等技术工作。 补充说明:同时也招聘面向25年应届毕业的同学;
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、团队负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式;主要工作方向包括: 1)优化&创新RLHF算法训练效率与模型泛化能力; 2)Long CoT技术的实现和应用; 3)多模态大模型(文本、图像、语音)的Posttraining算法; 4)构建高质量、多领域的数据合成方法; 5)探索LLM在情感对话、创作等场景的应用。