阿里巴巴淘宝平台事业部-多模态算法工程师(VLLM/CV/LLM)-商家智能服务
任职要求
1. 计算机科学相关专业(人工智能、计算机科学、电子信息工程、数学等)硕士及以上学历; 2. 有智能客服、多模态大模型、CV等背景和工作经验的,或在相关领域国际顶会发表过论文者优先; 3. 扎实的技术背景:对基于图像、视频、语音、文本等模态内容的各类算法算法有一定的理解,包括不限于图像/视频理解、图片分类、 检测、分割、OCR、图像视频生成等;了解VLLM/Vi…
工作职责
1. 负责将多模态大模型技术整合到小蜜智能问答系统中,不断提升系统的智能化水平和用户体验; 2. 研究并应用最新的多模态理解技术,如图像识别、自然语言处理和语音识别等,以实现系统对各种类型输入的处理能力,或将图像生成能力用于离线知识生产和实时问答; 3. 深入挖掘商品的图片、视频、文本介绍等各个模态中包含的有价值信息,理解并提炼商品问答知识; 4. 与数据科学团队合作,设计和实施模型训练策略,针对特定领域,进行多模态模型prompt设计和调优; 5. 深入跟踪调研多模态/NLP/CV等方向的前沿技术相关内容,包括文生图、图生文等。
1. 大模型技术研发与优化 深入探索大模型(如LLM、多模态模型)的核心算法,包括预训练、微调(Fine-tuning)、提示工程(Prompt Engineering)、RAG(检索增强生成)等技术,优化模型效果与性能。 *熟悉并能够设计和实现多智能体调度框架,结合大模型实现高效的任务调度和协作机制。 2. 大模型应用场景落地 负责大模型在垂直领域的应用开发,包括但不限于AIOps、代码生成/续写、智能问答、知识推理等场景,推动技术成果转化为实际生产力。 结合业务需求,设计高质量微调数据集和模型评估集,设计端到端的大模型解决方案,优化模型部署效率与推理成本。 3. 工程化与性能调优 熟悉Dify、LangGraph 等应用开发框架,能快速构建原型并推进产品化。 熟练使用Python,熟悉PyTorch/TensorFlow框架,具备CUDA/分布式训练经验者优先。 4. 跨团队协作与创新 与产品、数据、运维团队紧密合作,理解业务需求并设计技术方案。 跟踪学术界与工业界前沿技术(如Agent技术、MoE架构、MCP、A2A协议等),探索技术突破点。
1、负责大模型(LLM/多模态)核心算法的学习与探索,包括预训练、微调(SFT)、RAG及Prompt Engineering 2、参与多智能体(Multi-Agent)调度框架的设计与实现,探索高效的任务调度与协作机制 3、协助大模型在垂直领域(如AIOps、代码生成、智能问答)的应用落地,构建高质量数据集与评估体系 4、基于Dify、LangGraph、OpenAI Swarm等框架进行应用原型开发,并协助优化模型部署效率 5、跟踪学术界与工业界前沿技术,在导师指导下解决算法难题并推进产品化
1、负责优化小红书的多模态内容理解大模型算法,利用LLM、VLLM、Embedding、CV以及NLP相关能力,解决社区/大商业中笔记、评论、账号等多体裁的审核问题;优化小红书综合机审大模型; 2、负责包括但不限于预训练、SFT、RL、多模态表征、Agent搭建、AutoPE、RAG等,持续优化并时刻保持技术先进性,将业界SOTA模型落地并改进以获取审核业务线上收益; 3、紧密关注相关领域业界的最新进展,通过LLM/MLLM不断优化生态业务的机审能力,提高机审风险覆盖度和风险召回能力。建立并优化生态场景下的内容理解特征体系; 4、跟踪大语言模型、多模态、强化学习等算法的最前沿进展,探索其在小红书审核业务中的落地方案。
1、负责优化小红书的多模态内容理解大模型算法,利用LLM、VLLM、Embedding、CV以及NLP相关能力,解决社区/大商业中笔记、评论、账号等多体裁的审核问题;优化小红书综合机审大模型; 2、负责包括但不限于预训练、SFT、RL、多模态表征、Agent搭建、AutoPE、RAG等,持续优化并时刻保持技术先进性,将业界SOTA模型落地并改进以获取审核业务线上收益; 3、紧密关注相关领域业界的最新进展,通过LLM/MLLM不断优化生态业务的机审能力,提高机审风险覆盖度和风险召回能力。建立并优化生态场景下的内容理解特征体系; 4、跟踪大语言模型、多模态、强化学习等算法的最前沿进展,探索其在小红书审核业务中的落地方案。