Eval 审计：原理解析

要把一个复杂的 AI 评估系统分析透彻，Eval 审计遵循的是一套标准化的“六维诊断法”。你可以把它想象成对评估系统进行的一次全方位体检。

审计过程遵循严谨的逻辑，会按照以下维度进行层层穿透：

审计工具内置了一系列关于 LLM 评估的“金标准”。例如，我们会对比 Hamel Husain 的评估方法论，检查你是否在过度依赖李克特评分（Likert Scale），或者是否在没有验证真阳性率（TPR）的情况下就盲目信任裁判。

我们发现的每个问题都会被赋予一个“影响力等级”。

在审计过程中，此 Skill 主要读取你的配置文件和样本 Traces。我们不会修改你的原始数据，所有的诊断逻辑都在 piauthor 的安全沙盒内运行，确保你的业务敏感信息不会外流。