高德地图多模态大模型算法工程师-研发效能
任职要求
- 具备极佳的工程实现能力,精通C/C++、Java、Python等至少一门语言;对目前主流的深度学习平台:tensorflow、pytorch等,至少对其中一个有上手经验; - 熟悉多模态大模型的技术原理,有实际成果并发表…
工作职责
高德研发效能团队主要负责高德技术风险与效能中台的建设,利用大模型技术革新研发交付流程,提升整体研发和交付效率,支撑业务高速发展。工作内容包括但不限于大模型技术在 项目管理、需求理解、代码生成、测试用例生成、用例推荐、代码扫描、智能问答、质量评测、图面异常检测等研发效能领域的落地,以及多模态大模型方向的前沿技术探索。
1、基于大模型算法应用进行从需求创建到应用发布全流程各个环节提效工具的开发、建设,提升公司整体需求交付效率; 2、基于大模型算法对公司内部过往的各大提效系统和工具进行整体重建重构,建设智能化工具; 3、对于特定垂类场景模型进行训练、微调、优化评测等,提升模型在垂类场景上的效果; 4、基于公司内部研发过程中的各类痛点的问题,开发有针对性、有前瞻性的工具,并不断进行改进优化。 5、通过自研、集成、二次开发等多种手段,积极推进大模型应用和落地相关实践,系统性的提高研发、测试和项目交付管理全流程的能力和效率。
团队介绍 我们是京东科技云事业部AI Infra团队,致力于大模型核心技术的前沿创新与应用。我们专注于业界领先的大模型创新算法及框架研发,构建极致高效的基础大模型训练、推理与渲染一体化平台,提供高吞吐高可用、低成本低延迟的大模型服务。我们的核心使命是高效支持京东自研和业界主流开源基础模型的训练、推理与渲染服务,驱动京东集团内外部的智能体/具身/全模态等大模型业务生态及应用。我们团队秉承技术驱动、创新为本的理念,为每一位成员提供广阔的成长空间和富有挑战性的项目。 工作内容 1.研发智能体/具身/全模态大模型算法,结合RL Infra后训练基座Scale-Law优化,提高大模型训练、生成和仿真渲染效能; 2.基于MoE/DiT大模型架构,融合样本均衡/多P并行/压缩/量化/剪枝/算子融合等技术,进行算法与系统Co-Design优化,并推动业务落地; 3.追踪业界最新技术进展,开展大模型算法与RL Infra训练、生成和仿真渲染相关创新,发表高影响力论文,打造业界一流的大模型RL Infra服务能力。
【课题说明】 聚焦多模态数字人核心技术,以直播为应用场景,旨在突破其在真实感、智能交互、情感表达及多模态信息处理上的瓶颈。研发能自主执行复杂运营任务、展现丰富情感与高表现力,并与用户进行深度多模态内容互动的下一代数字人,革新直播行业运营模式与用户体验。 【建议研究方向】 1.智能运营Agent:研究数字人作为智能Agent,在直播前(策划、脚本、货盘)、中(场控、问答、促单)、后(复盘、再创)全流程承担运营职能。重点攻克基于多模态数据的智能决策、任务自动化及人机协同,提升直播运营效能。 2.高表现力数字人生成驱动:探索高真实感、个性化数字人形象(外观、声音、风格)的快速生成与定制。重点研究大模型驱动的、与语音同步且富含细腻情感的表情、口型、动作的实时驱动,增强直播感染力。 3.多模态内容生成和交互:研究理解用户多模态输入(文、语、图、视频)并进行深度互动。探索数字人自主生成动态多模态内容,丰富直播呈现,提升用户参与感。
1、研究前沿LLM、AIGC、多模态、NLP 算法模型到应用的转化,以及针对应用场景的算法优化; 2、将LLM、AIGC 算法模型 应用到业务产品中,提高产品的性能和用户体验; 3、将LLM、AIGC 算法模型 应用到快手研发平台中,提高平台的效能; 4、大模型训练、对齐相关工作,包括不限于思维链数据构造、模型构造优化、模型训练评估等; 5、协助开发和优化 AI Agent 的数据采集、分析及数据闭环相关工具,支持标注工具、研发工具、数据分析与可视化系统的设计与实现,提升产研团队的工作效率; 6、开发和集成多模态数据处理技术,构建跨模态数据融合框架,解决复杂业务场景下的信息提取和分析问题; 7、跟踪和研究最新的AI技术和趋势,撰写技术报告,参与学术会议和技术交流,提升公司在行业内的技术影响力。