Wink Pings

LlamaIndex 做了个 KYC 文档验证教程,用 AI 替代人工核对

金融机构验证客户身份的传统方式是人工逐份检查证件、对账单,成本高且容易出错。LlamaIndex 新教程展示了如何用 LlamaParse + Claude 构建自动化 KYC 流程:从驾照、水电账单、银行对账单中提取信息,再让 LLM 跨文档核对一致性。教程包含完整代码和样本数据。

金融机构必须做 KYC(了解你的客户),这是合规要求。开户前要验证身份证、地址证明、银行对账单等一系列文件,人工逐份比对,效率低到可怜。传统银行处理一个案例的成本是 **2200 美元**,而且错误会累积——假设每个字段准确率 95%,10 个字段下来只有 60% 的申请能直接通过。

LlamaIndex 联合创始人 Jerry Liu 最近发了篇教程,展示如何用 AI agent 自动化这个流程。核心思路很简单:先用 LlamaParse 从各类文档中提取结构化数据,再用 Claude 跨文档验证一致性。

具体分两步:

**第一步:身份提取(CIP)**。从政府颁发的驾照上提取姓名、出生日期、地址、证件号码。LlamaParse 会返回提取结果加上置信度分数和源文本引用,方便审计。

**第二步:尽职调查(CDD)**。从水电账单和银行对账单中提取信息,然后让 Claude 充当合规分析师,对比三份文档中的身份信息是否匹配。Claude 能处理 "J." 对应 "Jason"、"Street" 对应 "St" 这类格式差异,还能解释判断理由。

教程用了三个有意思的样本:一张官方驾照(含照片、水印、条码)、一份合成的多栏布局水电账单、一份**没有文字层的图片式 PDF 银行对账单**——最后这个直接筛掉大多数简单提取工具。

教程附带完整的 Python 代码和样本文档生成脚本,在 GitHub 上可以直接跑。链接在下面。

---

**延伸阅读**

- 教程地址:https://github.com/jerryjliu/llamaparse_use_cases/blob/main/kyc/tutorial.md

- LlamaParse:https://cloud.llamaindex.ai

发布时间: 2026-04-07 14:43