Agent 化改造方案

实验室 ERP 系统
智能化升级

在不替换现有 C/S 架构系统的前提下,通过 Agent 层实现智能化扩展,让用户可以用自然语言与 ERP 数据交互

4.5万
表头记录
56万
表身记录
4万+
图片文件
5-8周
AI 辅助交付

系统现状与核心痛点

老旧 C/S 架构缺乏 API 接口,数据孤岛问题严重,所有操作依赖客户端手动执行。

维度现状描述
架构C/S 架构,无 API 接口,所有操作依赖客户端
数据库Oracle,数据按「表头 + 表身」模式存储
数据量表头 4.5 万条,表身 56 万条
文件存储服务网盘,约 4 万个文件(图片为主),单文件 ≤ 100KB,存在大量重复
数据敏感度高敏感 — 含客户信息、测试价格等商业机密
🔒

数据孤岛

C/S 架构无 API,数据无法被外部系统调用

🐌

查询低效

依赖人工写 SQL 或固定报表,无法灵活提问

📊

分析滞后

数据分析依赖人工导出 + Excel,周期长

🖼️

图片混乱

4 万文件中大量重复,无智能检索能力

操作门槛高

增删改查依赖专业操作,非技术人员难以使用

四层架构设计

在现有 ERP 系统之上,叠加数据接入层、Agent 智能层和交互层,实现无侵入式智能化扩展。

用户交互层

智能中控台 Web UI 自然语言对话 移动端

Agent 智能层

路由 Agent 查询 Agent 分析 Agent 操作 Agent 搜索 Agent 识图 Agent

数据接入层 · API Bridge

Oracle 适配 NL2SQL 引擎 文件服务 权限网关 查询缓存

数据层 · 现有 ERP 系统

Oracle DB 服务网盘 / NAS 向量数据库 搜索索引

图片数据清洗与识别

在 Agent 化改造之前,先对 4 万张图片进行清洗和识别,为后续搜索/识图功能打好数据基础。

1

全量扫描

遍历 4 万文件,采集元数据,计算 MD5 + pHash 指纹

→ 文件清单 + 指纹库
2

去重清理

精确去重(哈希一致)+ 近似去重(pHash 相似),生成去重报告

→ 清洁图片库 ~2-2.8万
3

内容识别

OCR 文字提取、图片自动分类打标、视觉特征向量化

→ 元数据 + 向量索引
4

关联绑定

OCR 编号 ↔ Oracle 订单匹配,未关联的标记待人工复核

→ 图片-业务关联关系

五大核心功能模块

通过 5 个专项 Agent 覆盖查询、分析、操作、搜索和中控全场景。

01

智能查数据

自然语言提问,Agent 自动转 SQL 查询

功能点说明优先级
自然语言转 SQL「查一下上个月A客户的所有订单」→ 自动生成 SQLP0
表头表身关联自动处理表头-表身关联,用户无需了解表结构P0
查询结果格式化结果转为可读的表格 / 卡片 / 摘要P0
模糊查询与纠错支持模糊匹配客户名、产品名,自动纠错P1
查询历史与收藏保存常用查询,支持一键复用P2
查询结果导出支持导出为 Excel / PDFP1
典型场景
查一下客户XX近三个月的测试订单 今天有几个待处理的测试任务 编号 LAB-2024-0815 的订单详情
02

智能数据分析

多维度分析,生成洞察报告和可视化图表

功能点说明优先级
趋势分析订单量、收入、客户数等时间维度趋势P0
客户分析客户分级、贡献度、活跃度分析P0
异常检测价格异常、数据缺失、重复订单自动预警P1
对比分析同比 / 环比、跨客户 / 跨产品对比P1
自动报告生成定期生成周报 / 月报,包含关键指标和洞察P1
自然语言分析「分析一下Q3的收入构成」直接出结果P0
典型场景
分析今年前十大客户贡献占比 上季度订单量与去年同期对比 列出所有价格异常的订单
03

Agent 数据增删改查

严格权限控制下,代替用户执行数据操作

功能点说明优先级
智能新增通过对话创建新记录,Agent 引导填写必填字段P0
智能修改「把订单XX价格改为500」,Agent 确认后执行P0
批量操作「把所有待审核的订单状态改为已通过」P1
操作预览与确认写操作前展示影响范围,需用户二次确认P0
操作审计日志所有增删改操作完整记录,可追溯P0
回滚机制误操作可一键回滚到变更前状态P1
权限分级管理员 / 操作员 / 观察者权限不同P0
安全机制(必须):
删除 → 仅管理员 + 二次确认 + 确认码
修改 → 展示变更 diff + 用户确认
批量 → 限制单次条数上限,超限分批执行
04

智能搜索与识图

统一搜索入口,文本 + 图片双模态搜索

功能点说明优先级
全局搜索一个搜索框搜遍所有数据(订单、客户、产品等)P0
图片去重4 万张图片相似度检测,清理重复P1
以图搜图上传图片,找到关联的订单 / 产品记录P1
OCR 识别识别图片中的文字信息(报告单、标签等)P1
图片智能标签自动为图片打标签(产品类型、测试类型等)P2
语义搜索「找去年弹性测试失败的订单」等模糊搜索P1
05

智能中控台

统一 Dashboard,所有 Agent 能力的聚合入口

功能点说明优先级
实时数据看板关键业务指标实时展示(订单数、处理进度等)P0
对话式交互入口中控台内嵌 Agent 对话窗口P0
快捷操作面板常用操作一键触发(日报生成、数据导出等)P1
通知与预警异常数据、待处理任务、到期提醒等推送P1
Agent 协作可视化展示当前哪些 Agent 在工作、处理进度P2
个性化配置每个用户可自定义看板布局和关注指标P2
移动端适配支持手机 / 平板访问中控台核心功能P2

敏感度分级与安全约束

数据涉及客户信息与价格机密,必须建立严格的分级保护和 Agent 行为约束。

S3 高敏感

客户联系方式、合同价格 — 加密存储,按角色脱敏展示,Agent 禁止明文输出

S2 中敏感

客户名称、订单金额 — 按角色可见性控制,Agent 输出需权限校验

S1 低敏感

测试项目名称、日期 — 正常展示,记录访问日志

Agent 安全约束

AI 辅助开发排期

基于 AI 辅助开发估算,整体周期约为传统开发的 40%-50%,总计 5-8 周交付。

Phase 0 · 3-5 天

图片数据清洗与识别

  • 全量扫描 + 哈希计算(AI 生成脚本)~0.5d
  • 精确去重 + 近似去重 + 去重报告~0.5d
  • OCR 批量识别(调用现成 API/模型)~1d
  • 图片分类打标 + 向量提取~1.5d
  • OCR 编号 ↔ Oracle 自动关联 + 整理~1.5d
Phase 1 · 1-2 周

数据桥接层

  • Oracle 只读 API 封装(AI 批量生成)~2d
  • 表结构元数据整理(AI 辅助标注)~1d
  • 基础权限体系搭建~2d
  • 文件访问服务搭建~1d
Phase 2 · 1-2 周

智能查询 + 中控台

  • NL2SQL 引擎对接与调优~2d
  • 查询 Agent 开发~2d
  • 中控台 MVP 搭建(AI 生成前端)~2d
  • 数据脱敏层实现~1d
Phase 3 · 1-2 周

分析 + 操作

  • 分析 Agent 开发(AI 生成模板 + 图表)~2d
  • 操作 Agent + 安全机制~2d
  • 审计日志系统~1d
  • 自动报告生成~1d
Phase 4 · 3-5 天

搜索 + 识图

  • 向量数据库正式上线(复用 Phase 0)~1d
  • 搜索 / 识图 Agent 开发~1d
  • 全文搜索索引建设~1d
  • 以图搜图 + 关联查询上线~1d
阶段传统开发AI 辅助开发加速比
Phase 0 · 图片清洗2-3 周3-5 天3-4x
Phase 1 · 数据桥接4-6 周1-2 周3x
Phase 2 · 查询+中控台4-6 周1-2 周3x
Phase 3 · 分析+操作4-6 周1-2 周3x
Phase 4 · 搜索+识图3-4 周3-5 天4x
总计17-25 周5-8 周~3x

关键组件参考

LLM 大语言模型
私有化部署 / 专属 API

数据敏感度高,建议私有化

NL2SQL 引擎
LLM + Schema Prompt

基于表结构提示的 SQL 生成

向量数据库
Milvus / Qdrant / pgvector

语义搜索和以图搜图

搜索引擎
Elasticsearch / Meilisearch

全文搜索索引

API 网关
Kong / APISIX

统一入口,限流鉴权

OCR 引擎
PaddleOCR / Tesseract

中文场景推荐 PaddleOCR

图片特征提取
CLIP / ResNet

图片向量化,支持以图搜图

图片去重
pHash + MD5

感知哈希近似去重 + 精确去重

图片分类
微调 ViT / ResNet

产品图 / 报告单 / 标签 / 证书

审计日志
独立日志库

不依赖业务库,防篡改

风险与应对措施

风险影响应对措施
NL2SQL 生成错误 SQL查询结果不准确SQL 审核 + 结果采样校验 + 用户反馈机制
Agent 误操作修改数据数据被错误修改二次确认 + 保存点 + 回滚机制
数据泄露敏感信息外泄私有化部署 + 脱敏 + 审计
Oracle 性能影响影响现有 ERP 使用只读副本 / 查询限流 / 缓存层
图片处理耗时搜索响应慢预处理建索引 + 异步处理