横井利和のGeneXusブログ: 生成AIのコストはトークン消費量に比例するが、精度は比例しない

2026年5月4日月曜日

ここが生成AI の本質的な性質の話です。ネット上では色々なテクニックが転がっていますが、物事には必ず原理原則があります。そしてそれが発生するメカニズムがあります。生成AIに関する原理原則を知っておくと色々な現象がスッと腑に落ちます。

AI は会話を「覚えていない」

図4. AIは1回ごとに完結している(ステートレス)

身も蓋もない話ですが、現在の AI(LLM)は 会話を覚えていません。

「いやでも、ちゃんと前のやり取り覚えてるよね?」と思うかもしれません。あれは、毎回履歴を読み直しているから、覚えているように見えている だけです。

専門用語ではこの性質を「ステートレス(状態を持たない)」と呼びます。これは設計の選択じゃなくて、現在の AI の仕組み上の本質です。

図5. 履歴を毎回渡し直す

AI が記憶を持たないなら、どうやって会話が成り立つのか。答えはシンプルで、過去のやり取りを丸ごと毎回くっつけて渡している んです。

これがエージェントの基本動作。なお、これは 記憶の代わり であって、本物の記憶ではない、というのが大事なポイントです。

図6. 履歴は減らせない、まとめられない

生成AI は、過去のやり取りを 自分自身で要約する機能を持っていません。だから履歴は積み上がる一方になります。

履歴を要約させることはできますが、それは外から指示してやらせるのであって、AI 自身が自然にやってくれるわけではありません。

図7. コンテキストの中身の濃度は薄まる

履歴がどんどん積み上がると、見かけの情報量は増えます。でも、そのうち本当に役に立つ情報の比率(濃度)は下がっていく。

	初期	中期	後期
重要情報の濃度	100%	33%	17%
中身	全部役に立つ	過去の失敗・冗長が増える	大事な情報が埋もれる

役に立つ情報の割合 = 必要な情報 ÷ 全体の情報量、というイメージです。

これが、業界で言う 「コンテキスト汚染」 の正体です。

これが、現象B(料金と精度のミスマッチ)の正体です。

これまでの常識	実際に観測されたこと
情報を増やすほど賢くなる(右肩上がり)	途中で頭打ち、その後は逆に劣化

「もっと文脈を渡せば、もっと良い答えが返ってくるはず」 — じゃないんですよね。

ちょっと皮肉な話です。

つまり、容量の拡大が 意味密度低下のリスクに直結している。

解決策は、容量を使い切ることじゃなくて、容量の中で 「何を選ぶか(=何を残すか)」。