阿里云阿里云智能-Java 后端技术专家(通义点金)-新金融行业线(杭州/北京)
任职要求
1. 3年以上应用开发经验, 熟悉分布式系统的设计和应用,熟悉Mysql、ES、PG、Redis、MQ、Spring、Mybatis等常见数据中间件及框架。 2. 软件工程理论基础扎实,熟悉分布式服务理论基础。有软件分层概念,熟悉设计模式及原则, 有良好的编程习惯。 3、java基础扎实,熟悉jvm内存管理、GC算法,熟悉JVM参数调优,熟悉java集合类、多线程。 4、精通…
工作职责
职位描述: 1、参与并负责通义点金平台产品后端服务的设计、开发及维护。包括:Agent 构建能力、RAG 能力、数据飞轮能力、训推能力等相关模块的技术选型、技术架构、数据架构和开发工作。 2、参与并负责通义点金公共云/专有云服务的稳定性建设,报警,监控,容灾,降级等; 3、参与设计并实现具备可扩展性和可维护性的系统方案,并且需要符合金融企业客户对于合规, 性能, 安全的诉求。; 4、充分理解金融大模型业务,推进平台产品型系统建设; 5、沉淀技术能力和行业经验,实践和落地面向金融应用场景的AI能力,与平台和业务一起成长和发展。
团队介绍: ModelScope魔搭社区是中国最具影响力和最活跃的AI开源社区。秉承“模型即服务”的理念,魔搭围绕平台上开源的模型和数据集,针对各领域模型提供包括模型获取 、推理、 训练、评测、应用等全生命周期所需的开源技术组件。广大开发者基于魔搭的开源技术生态,以及社区站点和平台的支持,能迅速快捷的实现从模型到实际AI应用落地。 魔搭团队负责魔搭开源技术生态的研发,以及魔搭站点(modelscope.cn)与后端服务的整体建设工作。同时负责在快速迭代的AI领域,架接模型贡献者和模型使用者之间的桥梁。支持新模型,新应用的迅速接入,确保前沿模型在魔搭生态里的迅速落地。 职位描述: 1. 魔搭平台模型,数据集,创空间等功能研发以及后台服务的管理。 2. 通过与底层云基座打通,打造魔搭服务平台自动弹性和水平扩展能力,为千万级别的开发者用户提供稳定的服务,实现高效的计算资源使用。 3. 围绕魔搭的模型生态,开发各领域模型(尤其是大模型以及AIGC领域模型)实现应用落地所需的相关工具链。支持模型从ckpt落地为实际应用所需的自动化部署,评测等一系列工程链路。 4. 撰写技术设计文档以及用户文档,包括操作手册和最佳实践指南等。
1. 作为技术负责人,制定并推动多模态交互系统的端云整体工程架构演进路线,覆盖端侧推理、客户端集成、云端服务及协同策略。 2. 主导端侧AI推理框架的设计与优化,包括模型加载、算子加速、内存管理、功耗控制、异构计算(CPU/GPU/NPU)调度等,确保大模型在资源受限设备上的高效运行。 3. 负责Android客户端核心交互模块的架构设计与开发,包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 4. 设计高并发、低延迟、可扩展的云端推理服务架构,支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。 5. 构建端云协同机制,实现任务卸载、上下文同步、模型热更新、A/B测试等能力,提升系统整体鲁棒性与迭代效率。 6. 带领应用工程团队,负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。 7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作,推动系统从原型验证到规模化商用落地。
1. 面向ToB行业场景(如AI手机、智能座舱等),设计并构建可扩展、高可用的Agent编排系统,支撑多模态交互系统中复杂任务的自动化执行。 2. 深度整合阿里集团内部丰富的Agent能力,同时对接第三方生态服务,打造统一的行业级Agent应用。 3. 制定标准化的工具描述协议、Agent接入规范与开发者工具链(SDK/CLI/调试平台),降低内外部生态伙伴的接入门槛。 4. 针对车载、移动端等资源受限环境,优化Agent调用链路的性能、延迟与鲁棒性,支持离线、弱网、低功耗等边缘场景下的可靠运行。
阿里云PAI团队致力于打造业界一流的一站式AI工程化平台,拥有万卡级训练能力与超大规模异构资源调度技术,为复杂模型训练与推理任务构建坚实基座。PAI平台不仅是通义大模型研发与落地的核心基础设施,也作为公共云服务的关键载体,支撑众多行企业构建大模型核心业务。平台提供从数据标注、预处理、模型训练、推理服务到开发环境与工作流调度的全链路工程支持,全面覆盖AI项目从实验探索到规模化落地的完整价值链。作为平台研发工程师,您将深度参与以下工作: 1. 负责大规模异构资源管理与模型训练服务的全流程开发,包括需求分析、架构设计、软件开发、质量保障与部署上线。 2. 持续开展系统模块的深度剖析与迭代优化,提升资源利用效率、任务成功率与启动速度,降低使用门槛,增强产品满意度与客户粘性。 3. 负责平台线上环境的实时监控、故障定位与性能调优,为客户提供及时的专业技术支持,保障平台服务的高可用与高稳定运行。 4. 紧密追踪大模型、AIGC等前沿技术趋势,洞察并提炼高价值用户需求,推动平台功能持续演进与技术架构升级。