快手(大模型专项)多模态大模型算法工程师
任职要求
1、硕士及以上学历,有较强的代码动手开发能力,对多模态大模型基座能力提升有较高的热情; 2、熟悉计算机视觉相关的算法和技术,有自然语言处理和大模型训练经验; 3、良好的沟通协作能力,能够与团队…
工作职责
我们是谁 快手本身是一家以内容为主的公司,在大模型技术蓬勃发展的时代,多模态能力是快手非常重视的一个方向。目前团队主要的工作重心在视频理解和图片理解,包括短视频、长视频、直播、交互式视频等,主要的任务形态以Caption和QA为主,同时在生成类场景发挥着重要的作用。团队的主要工作围绕在数据组织、模型设计、训练范式设计上,会推出基座模型给到下游业务进行SFT,部分业务是紧密合作的。模型迭代会以业务反馈作为牵引,不断提升在自建指标和公开指标上的成绩。 职位描述 1、探索多模态理解任务上的自研数据构建、模型架构和训练范式,打造业界第一梯队的多模态大模型; 2、搭建更有针对性的评测,用于真实反映模型的实用效果,为模型训练提供指导方向; 3、强化Caption和QA能力,在图片/视频的理解/描述能力上赶超GPT4o、Gemini Pro等闭源模型的实际使用效果; 4、洞察业务需求,能够以业务目标为牵引持续迭代模型,在支持好业务的同时,发掘多模态的独立出圈应用玩法; 5、探索技术边界,将有特点的技术成果进行学术转化,在顶尖学术会议上发表论文,并保持与业界专家的交流。
【岗位亮点】 打造现象级AI产品:你的代码将服务数亿用户,每天为千万级出行需求提供个性化解决方案 前沿技术实践场:深度参与出行垂类大模型的训练与优化,探索LLM+时空智能的无限可能 真实场景大挑战:处理中国最大规模出行数据,构建具有空间语义理解能力的行业标杆级AI 【团队成就】 我们团队致力于构建下一代核心智能驾驶体验,在过去四年持续创造多个突破性创新产品技术。 智能出行开拓者:连续4年推出行业标杆产品,包括: • 全球首个分钟级交通事件检测系统(2021) • 业内首创大规模红绿灯倒计时推演技术(2022) • 基于实时天气的智能防晒导航(2022) • 车路协同V2X技术(2023) • 红绿灯AI领航功能(2024) 【你将参与】 1. 用AI解锁出行新玩法:基于海量地图数据与用户场景,研发支持"燃脂路线""赏花专线""游戏IP主题路线"等创新功能的智能规划引擎 2. 打造行业领先的大模型应用:通过Prompt优化、SFT微调、强化学习等技术,让大模型真正理解复杂出行需求中的时空语义关系 3. 构建智能出行知识库:主导多模态数据处理,建立覆盖POI理解、实时路况分析、用户画像建模的千万级出行数据库 4. 定义未来出行方式:探索大模型在动态路线规划、智能交互导航等场景的突破性应用,持续输出行业领先的技术方案 【加入我们,你将获得】 与行业顶尖专家共事,参与日均百亿级请求的核心系统研发 完善的技术成长体系,包括大模型专项培训、季度技术workshop
关于我们 我们是阿里巴巴国际数字商业集团-阿里巴巴国际站-Accio算法团队。阿里巴巴国际站是全球最大的跨境B2B数字化贸易平台。 我们团队一直追求极致的技术创新 (每年都有多篇顶会paper),从Bert到T5,多次推动业务跨越式发展。去年自研LLM完整技术栈,成功驱动生意助手大规模商业化落地。今年正在全力打造全球首个B2B AI Sourcing Agent,自研Agent框架和全新AI Search系统,目前已成功全球发布,迈向更广阔的未来。 职责描述: 1. 负责跨境电商垂直多语言多模态大模型的研发,包括SFT到RLHF的LLM全链路post-training技术建设。 2. 负责AI Native专项能力建设,包括但不限于NL2SQL, RAG System, Agent System, Function Call, Workflow Reasoning等。 3. 负责跨境电商AI创新业务落地,包括但不限于用最前沿的RAG/Agent技术,重构B2B Sourcing的全新交互体验。 4. 负责LLM的前沿技术探索,持续迭代自研模型能力,支撑AI Native产品落地。
我们是阿里巴巴国际数字商业集团-阿里巴巴国际站-Accio算法团队。阿里巴巴国际站是全球最大的跨境B2B数字化贸易平台。 1. 负责电商搜索场景的Agentic Pro Search/Deep Research等能力的开发实现,负责跨境电商垂直多语言多模态大模型的研发,包括SFT到Agent Reinforcement Learning的LLM全链路post-training技术建设。 2. 负责AI Native专项能力建设,包括但不限于 Agentic Reasoning, Agentic RAG System, Multi-Agent System等。 3. 负责跨境电商AI创新业务落地,包括但不限于用最前沿的Reasoning/Agentic RAG技术,重构B2BSourcing的全新交互体验。 4. 负责LLM的前沿技术探索,持续迭代自研模型能力,支撑AI Native产品落地。