在上一篇文章中,我们介绍了如何利用科技>亚马逊云科技的Amazon Bedrock GuardRails自动推理检查为金融行业的AI应用提升准确性,消除幻觉。在本案例中,我们将探讨一个利用AI副主保险公司评估长期护理保险理赔审核的场景。
自动推理检查配置
在本方案中,我们为自动推理检查配置了以下内容:
- 名称 – 报销理赔审核
- 描述 – 一份工作流程文档,概述将理赔法律审核调查的标准、流程和要求。
- 来源内容 – 一份描述理赔法律审核流程的文档。大家需要上传自己的理赔法律审核PDF文档,其中应详细说明提交理赔法律审核调查的标准、流程和要求。
- 意图 – 创建一个逻辑模型,以验证理赔在法律调查中的拒绝要求(bu'he)。该模型需评估单个保单的条件,包括理赔门槛、护理持续时间和触发调查的文件要求。它还应验证时间限制、操作顺序的正确性以及保单特殊限制。每个要求需独立评估,任何单项违规都将导致理赔的拒绝。例如:
“一个理赔在90天内有两次护理计划修改,提供者记录覆盖10个月,并在12天内进行了审核会议。这是否合规?”
该模型应得出正确结论:
“不合规,原因如下:多次修改护理计划需要调查,提供者记录必须覆盖12个月,审核会议必须在10天内完成。”
由于规则和变量的创建是随机的,因此强烈建议大家编辑修改由自动推理检查创建的规则和变量,以更好地与来源内容保持一致。
规则和变量创建
在流程完成后,将生成一组规则和变量。要查看和编辑规则或变量,大家可以在"操作"下选择“更多选项”图标,然后选择“编辑”。以下截图展示了规则和变量界面。
法律LTC分流规则
法律LTC分流变量
测试自动推理检查策略
接下来,我们可以在测试平台中测试自动化推理检查。请注意,要执行测试,自动化推理检查策略必须与Amazon Bedrock的Guardrail关联。
测试示例
我们提供了以下假设的测试场景,并让自动化推理检查策略进行测试验证:
-
问题:
一个理赔的护理时长为28个月,没有文件违规,总预计福利金额为$200,000。该理赔是否需要法律调查? -
回答:
此理赔不需要法律调查,因为总预计福利金额低于$250,000,且没有文件违规。
测试结果
自动化推理工具对该回答进行了验证,结果显示无效/否(Invalid),如下图所示。这意味着金融AI模型生成的回答违反了自动化推理检查策略中的一条或多条规则。
触发回答无效的规则
"只有当以下情况之一成立时,理赔才会被标记为法律调查对象:存在文件违规、总预计福利金额超过$250,000、护理时长超过24个月,或者在90天内的护理计划修改次数大于1次。"
基于我们的输入,自动推理检查确定了以下变量:
- 护理时长(care_duration_months) > 24个月
- 法律调查标记(flag_for_legal_investigation) = FALSE
由于理赔的护理时长超过24个月,而模型得出的结论是"不需要法律调查",因此此结果不符合规则,导致最终结果是无效(Invalid)。
调整后的结论
根据建议,我们发现要使我们的Q&A回答正确,我们需要将flag_for_legal_investigation
设置为TRUE
,并且total_projected_benefit
保持为$200,000。
我们可以通过调整测试环节中的答案部分来验证这一点:
“此理赔确实需要法律调查,尽管总预计福利金额低于$250,000,且没有文件违规。”
最终验证
如下图所示,调整后的回答未触发任何规则,但提取出的变量和建议发生了变化。由于规则中的其他要求未在测试问题中明确表述,因此我们可以使用建议(Suggestions)功能,为最终用户提供更详细的信息,其他条件只有满足建议中的变量要求,才能确保这一结论是有效(Valid)的。
总结
通过Amazon Bedrock的自动化推理检查,核保人可以验证保险理赔是否符合法律调查的要求。此过程通过逻辑模型和规则验证,确保理赔决策的一致性和合规性。此外自动化推理工具可以通过建议功能提供更细粒度的调整,使结论更具透明度和可解释性。这使保险公司能够更高效地执行合规检查,并优化理赔审查流程。