高德地图生成式大模型算法实习生
任职要求
全日制硕士及以上学历,人工智能、计算机、数学等相关专业背景。 熟悉生成模型理论,掌握 VAE / Diffusion / AR 等至少一种生成算法方法。 有大规模分布式机器学习系统研究或应用经验,熟悉分布式训练框架…
工作职责
参与生成式大模型核心算法的研发与实验,包括 Diffusion、Autoregressive(AR)、VAE、Transformer 等架构。 协助设计并实现大模型的训练与优化流程,从预训练到后训练(SFT、RLHF)。 探索时空视频编码、压缩与生成算法,提升生成任务的时序质量与性能表现。 跟踪行业与学术前沿研究,参与创新技术的实验与评估,并推动成果转化为学术论文或技术报告。
团队介绍:负责影像业务剪映、醒图等创作工具的增长、内容分发和商业化的算法,以及数据科学相关工作,致力于激发用户创作灵感、优化创作效率和提高所创作内容的价值,并完成增长与商业化变现。 课题介绍:剪映CapCut创作工具需要更自动化的扩大模版与素材的供给,降低创作过程的难度,本课题旨在通过AIGC根据当前热点,推荐,搜索等分发线索自动生成模版、素材、音乐,大规模补充模版与素材供给,为用户提供更多创作灵感,以及根据用户上传素材,AIGC辅助自动成片。 1、基于多模态大模型(LLM/视觉/音频)技术,研发自动化内容生成系统,通过分析热点、搜索趋势及用户行为数据,构建动态生成模型,实现视频模板、风格化素材、场景适配音乐的规模化生产,提升创作工具的内容供给多样性; 2、研究用户意图深度理解模型,通过用户上传的原始素材(图片、视频片段、文字描述)分析创作目标,构建端到端的自动成片Pipeline,实现镜头分割、转场特效生成、字幕匹配、音乐适配的全流程AI化; 3、设计跨模态对齐算法,解决图文/视频/音乐的多维度语义匹配问题。
1、负责生成式大模型在商业化营销业务场景的前沿探索与应用; 2、负责CTR/CVR/LTV等广告排序核心模型的优化和创新; 3、负责强化学习、深度学习在商业化营销业务的前沿探索与应用。
1、负责广告业务中大模型能力的研发与落地,包括广告商品识别、广告素材生成、智能创编、智能助手等核心场景; 2、提升自然语言理解的能力,比如意图识别,NL2SQL,向量召回,结构化/非结构化,短文本/长文本的表征学习等; 3、负责优化LLM生成式大模型的在场景下的微调,使其以更自然、精准、友好、可控的方式与用户沟通; 4、建设基于RAG框架的智能问答系统,优化文本、召回、相关性、问答生成、构建知识图谱、实体抽取等算法; 5、负责快手广告素材、广告商品等投放业务场景下的内容理解与内容优选算法工作,建设多模态大模型、生成式模型等前沿模型技术能力; 6、跟进业界前沿算法,探索NLP/LLM大模型等技术,并结合业务场景取得应用落地。
