业务背景
随着AI大模型时代的发展,AI 智能体的落地已成为企业提升竞争力的关键,而业务数据则是 AI 智能体的核心基础,也是智能体做出精准决策的关键依据。没有高质量的业务数据,智能体将无法完成后续工作,低质量的数据甚至可能导致结果偏差或错误的决策,进而严重影响智能体的最终效果和业务价值。
在当前的智能体工作流中,数据检索环节存在诸多待解决的问题。每次工作流运行时,都需要从知识库中重新检索数据,这一过程不仅消耗大量算力资源,还显著增加了数据错误的风险。此外,数据的分散管理和缺乏统一标准,进一步降低了工作效率和数据质量。
为彻底解决这一痛点,我们构建了一套支持 LLM 智能体落地的 AI 业务数据服务管理解决方案,以沉淀高质量业务数据,为 AI 模型训练与应用提供坚实支撑。
核心功能模块
全生命周期业务数据仓
- 原始数据分类管理
- LLM生成内容存储
- 统一业务数据模型
数据标注功能
- 多人协作标注工作台
- 业务数据版本控制
- 溯源关系追踪
- 数据计算与结构化
API调用功能
- 标准化API接口
- API调用记录
- 服务监控管理
统计分析
- 调用次数统计
- 响应时长监控
- 使用趋势分析
分类分级体系
- 多级分类分级管理
- 标签体系构建
- 分类关系可视化
用户角色与旅程
业务人员
旅程:上传原始研究数据 → 发起标注任务 → 版本对比 → 接入模型服务
主要职责:上传研究数据、发起标注任务、进行版本对比、接入模型服务进行实验分析。
核心目标:高效管理研究数据,完成标注任务,对比不同版本的数据或模型输出,调用模型服务进行实验。
关键点:数据版本管理、标注任务协作、模型调用灵活性、实验结果的准确性、数据结构化处理。
数据标注人员
旅程:接收标注任务 → 核对数据来源 → 进行数据标注 → 提交标注结果
主要职责:核对数据来源、进行数据标注、使用Excel数据计算功能、生成结构化数据。
核心目标:高效准确地完成数据标注任务,确保数据质量。
关键点:数据溯源的便捷性、标注工具的易用性、结构化数据提取的准确性。
管理员
旅程:监控服务调用 → 资源配额管理 → 生成机构级报告
主要职责:监控服务调用、管理资源配额、生成机构级报告、管理权限和审计日志。
核心目标:确保系统稳定运行,合理分配资源,保障数据安全。
关键点:服务监控的实时性、配额分配的公平性、报告生成的自动化、权限管理的严格性。
AI工程师
旅程:调用数据API → 集成到智能体工作流 → 监控数据使用效果
主要职责:通过API调用系统数据、将数据集成到智能体工作流、监控数据使用效果。
核心目标:高效获取高质量数据,减少重复检索,提升智能体性能。
关键点:API接口的稳定性、数据获取的准确性、智能体工作流的优化。
功能架构设计
数据中枢层
- 全生命周期业务数据仓
- 版本控制系统
- 溯源关系图谱
服务功能层
- 多人协作标注工作台
- 数据计算与结构化工具
- 标准化API接口
- 统计分析仪表盘
管理控制层
- 权限管理
- 配额管理
- 审计日志
- 多级分类分级管理
关键特性与优势
统一数据模型
将各类数据抽象为"数据资产+版本链+元数据"的统一模型,实现标准化管理,提高数据质量和一致性。
数据计算与结构化
提供Excel数据计算功能,支持从数据中按用户自定义规则提取信息并生成结构化数据(如JSON),实现半自动化标注,提高效率。
溯源关系追踪
支持数据批注和标记,当选择数据时,将数据向量化与源文件计算相似度并即时显示来源文件,包括多文件来源(相似度值)和内容片段等关键信息。
标准化API网关
提供标准化的API接口,允许工作流通过调用接口直接获取已确认的数据,具备良好的兼容性和安全性,支持多种业务平台的调用。
导航优化方案
主菜单结构
- 全生命周期业务数据仓(数据管理/搜索/筛选/收藏)
- 数据标注中心(任务管理/多人协作/质量检查/数据计算与结构化)
- API服务中心(接口管理/调用测试/调用记录)
- 统计分析中心(调用统计/响应监控/趋势分析/报表生成)
- 系统管理中心(权限管理/配额管理/分类分级管理/审计日志)
快捷操作区
- 数据上传与导入
- 标注任务创建
- 数据结构化处理
- API调用示例
工具栏功能
- 数据溯源查看
- 版本历史对比
- Excel数据计算
- 结构化数据预览
系统功能表
功能模块 | 功能点名称 | 功能描述 | 主要使用角色 |
---|---|---|---|
全生命周期业务数据仓 | 原始数据管理 | 支持数据的分门别类管理,通过标签、分类等方式,方便快速查找和筛选 | 业务人员、数据标注人员 |
全生命周期业务数据仓 | LLM生成内容存储 | 将工作流中检索到的数据按照统一业务模型进行存储 | 业务人员、AI工程师 |
数据标注功能 | 多人协作标注 | 支持实时协作、角色权限管理、即时沟通工具与进度跟踪 | 数据标注人员、业务人员 |
数据标注功能 | 数据计算与结构化 | 提供Excel数据计算功能,支持从数据中按用户自定义规则提取信息并生成结构化数据 | 数据标注人员、业务人员 |
数据标注功能 | 溯源关系追踪 | 支持对数据的批注和标记,显示数据来源文件,包括多文件来源和内容片段 | 数据标注人员、业务人员 |
API调用功能 | 标准化API接口 | 提供标准化的API接口,允许工作流通过调用接口直接获取已确认的数据 | AI工程师 |
管理控制层 | 权限管理 | 基于RBAC模型管理用户权限,确保数据安全 | 管理员 |
业务系统关键状态
数据资产状态
- 数据状态:草稿、已上传、已标注、已结构化、已发布、已归档
- 访问权限:公开、项目内、私有
- 数据来源:原始数据、LLM生成内容
标注任务状态
- 任务状态:待分配、进行中、已完成、已审核、已废弃
- 标注质量:未评估、合格、需修正、优秀
- 结构化状态:未处理、处理中、已结构化、结构化失败
API服务状态
- 服务状态:开发中、测试中、已上线、已停用
- 调用权限:开放、受限、禁用
- 调用统计:调用次数、响应时长、成功率