第26章:Observability——AI系统的可观测性体系26.1 问题定义:为什么AI系统需要可观测性传统软件的可观测性关注三个维度:Logs(日志)、Metrics(指标)、Traces(追踪)。AI Native系统需要额外的可观测性维度,因为:AI行为不可预测:同一个Prompt,不同时间可能产生不同输出Token消耗影响成本:每次AI调用的Token消耗直接影响运营成本Context质量影响输出:Context质量下降时,输出质量如何变化Agent行为需要追踪:多Agent协作时,每个Agent做了什么、消耗了多少资源没有可观测性,你就无法:知道AI每天消耗了多少Token(成本黑洞)知道哪些Skill效果差(浪费资源)知道Agent在哪里失败了(无法优化)知道Context质量是否在退化(质量黑洞)26.2 AI可观测性的六大维度维度1:Token Metrics(Token指标)核心指标: