基于大模型Agent的快递包裹检测与赔付决策系统

约 1258 字大约 4 分钟

仓库地址

项目概述

本项目旨在利用多模态大模型，对破损快递包裹进行识别，获取破损程度，并结合快递公司赔付政策，利用增强检索（RAG）技术，快速检索相关条款并生成赔付结果。项目集成多模态大模型图像识别、数据向量化存储检索、Agent决策等技术，为物流行业提供智能化解决方案。

用户上传破损包裹图片
       ↓
图像识别（多模态LLM分析破损类型和程度）
       ↓
RAG检索（从Chroma向量库中检索相关赔付条款）
       ↓
Agent决策（结合识别结果和赔付规则生成决策）
       ↓
输出赔付结果 + 决策解释

使用 Gemini 2.5 Flash 等多模态大模型对上传的快递包裹图像进行分析，识别破损类型和程度。

将快递公司的赔付政策文档进行预处理，分段存储至 Chroma 向量数据库，便于后续检索。

基于用户上传的破损图像识别结果，从 Chroma 数据库中检索相关赔付政策条款。

为什么用RAG而不用大模型直接判定？

在赔付场景中，决策必须遵循特定的业务规则。因此，先用RAG检索相关规则和文档，再让Agent基于检索到的信息生成决策，可以大幅提高准确性和可控性。

使用 LangChain 框架构建赔付决策Agent，结合识别结果和赔付条款进行决策。

为什么用AI Agent而不用传统规则系统？

传统规则系统依赖预定义规则和条件，在业务逻辑清晰时表现良好。但当情况变得复杂时，很难用规则覆盖所有场景。AI Agent系统更灵活，能够结合推理能力和外部信息来处理复杂场景。

在测试过程中，我发现了一个经典问题：多模态冲突。

当图片上直接添加文字信息时，模型有时会优先依赖文字而忽略视觉信息，导致识别结果不准确。

构建可靠的AI系统不仅需要强大的模型，还需要适当的系统设计、验证和工作流控制。

我通过构建测试集对系统进行了评估：