logo of jd

京东低代码编程智能体的自动化质量校验能力研究

校招全职多模态大模型与应用方向地点:北京状态:招聘

任职要求


1、 获得本科及以上学历,计算机科学、软件工程、人工智能等相关专业;
2、 具备扎实的编程能力、数据结构算法基础,熟悉PythonJavaJavaScript/TypeScriptGo等至少一种主流语言及常用工程工具链;
3、 熟悉大语言模型、Agent、工具调用、RAG、Prompt Engineering及模型评测相关技术,能将模型…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、 研究电商领域低代码CodingAgent全链路质量校验方法(涵盖代码/测试生成、依赖安装及构建运行),提升智能体产出代码的正确性与可维护性;
2、 设计低代码质量评测体系,结合静态分析、端到端测试及LLM-as-a-Judge等手段,构建可复用的自动化校验框架;
3、 研发适配智能体平台的校验Harness、任务回放与失败归因能力,实现从需求理解到验证报告的闭环度量与落地;
4、 探索基于多Agent协同的代码审查、缺陷定位与自动修复策略,提升智能体在复杂仓库、多语言与多框架场景下的泛化能力;
5、 参与课题验证与业务落地,沉淀相关技术文档、专利或高质量学术论文,推动成果在京东研发效能及运营场景中的应用。
包括英文材料
学历+
数据结构+
算法+
Python+
Java+
JavaScript+
TypeScript+
还有更多 •••
相关职位

logo of kuaishou
社招3-5年J0012

1、参与快手大规模深度学习推理框架的研发与优化,保障在线系统的高可用/高并发,为快手搜索数亿用户提供高效稳定的算力输出; 2、负责快手搜索模型推理优化工作,优化模型推理性能,高吞吐低延时支撑模型推理服务; 3、 支持大模型在搜索场景落地的相关模型优化,包括不局限于AI检索,Query改写等。

更新于 2026-02-25北京
logo of eleme
社招2年以上技术类-开发

1.负责搜推系统和引擎的设计与开发,构建高性能、高并发的分布式架构,支撑搜索与推荐业务的核心场景; 2.负责设计高性能数据结构,支撑海量数据下各种复杂索引结构的低延迟查询; 3.负责搜推技术框架的规划与设计,负责产品的核心功能、公共核心模块的代码编写; 4.与算法团队紧密合作,负责深度学习模型的线上推理性能优化,支撑全场景各种复杂模型的在线推理业务需求; 5.探索新技术方向,参与AI工程化项目,通过技术创新解决实际问题,推动系统性能和稳定性持续改进。

更新于 2026-02-04北京|上海
logo of amap
社招2年以上技术类-开发

1、负责高德出行场景(驾车,骑行,步行)的大模型应用框架开发,构建高可用、低延迟的分布式系统; 2、负责优化Agent决策引擎、任务调度、多模态数据处理等模块的性能与稳定性; 3、负责搭建Agent与外部系统(如数据库、API、第三方服务)的高效通信机制; 4、负责保障大模型应用系统架构的稳定、高效运行,帮助业务优化性能和改善系统稳定性; 5、负责协调业务资源,与大模型算法和数据源服务等团队协作,保障项目有效落地和需求高效交付。

更新于 2025-12-02北京
logo of netease
社招网易有道

1. 面向有道词典、词典笔、学习规划/小P老师等产品线,负责 Agent 能力的整体方案与核心算法研发,包括任务分解、计划-执行/反思循环(Plan-Execute / ReAct / Reflection)、长短期记忆与工具路由等; 2. 负责 SLM(Small Language Model)持续预训练与指令微调(SFT),构建高效压缩与蒸馏方案,面向端侧/低延迟场景优化推理效率; 3. 设计与实现工具调用(Function/Tool Calling)体系:工具编目与路由、参数填充、结果验证与回退、调用链追踪与可观测性,提升工具使用的成功率与收益; 4. 基于强化学习(PPO/GRPO/DPO 类方法等)与奖励建模,面向语义理解、工具使用成功率、内容生成质量等目标进行对齐与优化,支持离线/在线策略迭代; 5. 负责搜索与排序相关模型:语义检索embedding/rerank、学习排序(pointwise/pairwise/listwise)、点击/转化信号建模与评估; 6. 负责数据全链路:高质量数据构建、策略采样、合成与清洗、去重与去噪、难例挖掘、失败案例回放及工具轨迹数据集构建; 7. 建立系统化评测体系:离线基准(理解/工具成功率/可用性)、端到端任务评测、A/B 实验与线上指标监控,推进效果持续迭代; 8. 推动工程化落地:训练管线与分布式并行、推理服务化与弹性扩缩、缓存与检索加速、成本/时延/稳定性优化; 9. 跨团队协作,与产品、工程、数据及标注团队紧密配合,按期高质量交付,持续提升用户体验与业务指标。

更新于 2025-12-21北京