
同花顺多模态AIGC推理工程师-ACMer
任职要求
1、本科及以上学历,计算机/数学/机器学习相关专业毕业,有3年以上优秀的编程/机器学习相关工作经验; 2、主导/参与过大模型训练、调优、应用;熟悉 RAG/GraphRAG、Prompt 工程、知识图谱或模型记忆; 3、有多模态/AIGC经验者优先,包含图像视频理解、生成等; 4、了解…
工作职责
1、负责AIGC等技术应用研发,落地 Design-to-Code 能力与多模态模型,提升生成质量与可维护性;建立自动评测体系; 2、基于大模型技术(如Transformer、diffusion模型)开发图文生成、图生文等多模态算法,并优化生成稳定性与一致性。 3、解决图像识别、图像分类、图像分割、文本语音生成视频等实际业务问题,推动技术落地。 4、通过数据预处理、特征工程和超参数调优提升模型性能,并进行算法迭代与推理加速优化。
1、驾驭亿级规模核心系统:负责本地零售亿级商品库的顶层架构设计与演进,主导 SPU/CSPU 等基础模型建设,支撑高并发下的搜索、选品及多渠道分发,打造行业领先的商品数据底座。 2、引领前沿的 AI 大模型落地:深度参与AIGC 在商品全生命周期的变革,利用多模态大模型重塑智能发品、自动归类、内容生成及质量质检流程,推动业务从“人工运营”向"智能自治"跃迁。 3、构建数据与智能闭环:携手算法与产品团队,建立“数据 - 模型 - 业务”的高效反馈闭环。通过RAG 知识库、批量推理及自动化实验等前沿技术,持续优化商品数据的准确性与转化效率,赋能零售搜索与智能决策。 4、探索研发新范式与极致性能:在保障系统高可用与极致稳定性的同时,率先探索 Vibe Coding、AI Agent 等新范式在研发流中的落地,提升团队整体效能,解决海量数据下的复杂工程挑战。
团队介绍: 我们团队聚焦多模态模型、大语言模型、扩散模型的前沿探索和算法应用。团队承接公司核心业务,深耕人工智能前沿领域,在业内有持续影响力,在NeurIPS/ICLR/CVPR/ACL/EMNLP等顶会已发表多篇论文。 具体职责包括但不限于: 多模态模型、扩散模型、图像编辑的研究和应用,包含但不限于文本、图像的跨模态对齐和AIGC内容生成。 大语言模型的前沿探索和应用,包括但不限于SFT和RLHF算法、CoT、Hallucination、Agent等领域的探索与研究; 大模型的效率研究,包括但不限于大模型的量化、蒸馏、训练与推理加速。
我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 团队主要聚焦多模态大模型技术在端到端自动驾驶的应用,我们期待你的工作将覆盖以下至少一个技术方向即可: 1. 在端到端自动驾驶、多模态大模型的训练及调优、BEV感知、基于深度学习/强化学习的规划控制、RLHF、驾驶场景视频生成等领域具备丰富且有独创性的研究经历。 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等。 3. 了解大模型模型的训练/微调/推理加速方法,包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理,模型部署加速等。 4. 参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用。 5. 负责收集、整理和分析自动驾驶相关的数据集,进行数据预处理和标注,以提高模型的准确性和泛化能力。 6. 设计和实现端到端自动驾驶模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。