国内最大級の掲載数 × 最短1分で探せるAI検索

▶︎ 情報掲載をご希望の方へ

メルマガに登録(無料)
  1. AI BEST SEARCH
  2. AI関連用語集・キーワード一覧【AI BEST SEARCH】
  3. トップk・トップpサンプリング(Top-k/Top-p Sampling)

トップk・トップpサンプリング(Top-k/Top-p Sampling)

トップk・トップpサンプリング(Top-k / Top-p Sampling)とは、自然言語処理(NLP)において、言語モデルが次の単語を生成する際に使われる確率的なトークン選択手法です。 単純な「最大確率トークンの選択(グリーディーデコード)」とは異なり、ランダム性を取り入れながらも、意味の通る自然な文を生成することを目的とした生成戦略です。 ▼ トップkサンプリング(Top-k Sampling) 次の単語候補として、確率の高い上位k個のトークンのみを候補に絞り、その中からランダムに1つを選ぶ方法です。 kが小さいと決定性が高くなり、kが大きいと多様性が増します。 例:k = 10 なら、確率上位10語の中から1語を確率に応じて選択。 ▼ トップpサンプリング(Top-p Sampling / Nucleus Sampling) 次の単語候補として、累積確率がp(例:0.9)を超えるまでの上位トークンを選び、その中からランダムに1つを選ぶ方法です。 top-kと異なり、確率分布に応じて候補数が動的に変わるのが特徴です。 例:p = 0.9 なら、もっとも確率の高い語から順に足し合わせて、合計0.9を超えるまでの語を候補にする。 これらのサンプリング手法を用いることで、以下のようなメリットがあります: • 同じプロンプトに対しても多様な出力が得られる(創造性の向上) • 意図しない繰り返しや単調な応答を避けられる(特に長文生成で効果的) • 生成文の自然さと制御性のバランスが取れる GPT系の言語モデルや対話AIなどでは、top-kとtop-pを併用し、温度(temperature)パラメータと組み合わせて調整することで、自然さ・一貫性・創造性を最適化したテキスト生成が行われています。 この手法は、ChatGPTやBard、Claudeなどの生成AIでも実装されており、ユーザー体験の質を左右する重要な生成アルゴリズムの一つとされています。