+- ToolDiff

$ benchmark --status

Coming Soon

独自ベンチマークテストを準備中です。API実測によるレイテンシ、品質スコア、コスト効率の定量比較を公開予定。

// Planned benchmarks:

- Response latency (TTFB, tokens/s)

- Japanese language quality

- Code generation accuracy

- Cost per 1M tokens

- Context window utilization