2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家
我运行了一个小型智能体。分为三个步骤:一次网络搜索、一次摘要生成、一次引用核查。我原本的预算大约是 12 美分。
运行结束后的账单却是 4.20 美元。
我察觉到有些不对劲,但按次调用的发票明细并未提供任何有用信息。它们只是一列 messages.create 调用记录。我需要将这些调用归组到产生它们的运行任务中,并分析成本结构。
这正是 agenttrace-rs 所填补的空白。它是一个 Rust 语言库(crate),能够将大型语言模型(LLM)的调用聚合为运行任务,并提供成本、延迟以及按模型细分的数据。
暴露问题的细分数据
use agenttrace::{Trace, Run};
let mut trace = Trace::new();
let run = trace.start_run("cite-check-agent");
run.record_call(claude_cost::estimate(&req1, &resp1));
run.record_call(claude_cost::estimate(&req2, &resp2));
run.record_call(claude_cost::estimate(&req3, &resp3));
// ... 依此类推,记录每个工具结果/后续步骤
let summary = run.finish();
println!("{}", summary.report());
它为这次 4.20 美元的运行任务打印出的报告如下:
run: cite-check-agent duration: 38.4s total_cost_usd: 4.2031
calls: 11
p50_latency_ms: 2710
p95_latency_ms: 4920
by-model:
claude-opus-4-7: 9 calls $4.1880 avg_input_tok: 18,420 avg_output_tok: 540
claude-haiku-4: 2 calls $0.0151 avg_input_tok: 免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。