ChatGPTはユーザーの会話から学んでいるのか?

何百万人ものChatGPTユーザーがいる中で、OpenAIはその会話全てをどう処理しているのだろうと思うかもしれません。ChatGPTで話していることを常に分析しているのでしょうか?

ChatGPTはユーザーの入力から学習しますが、多くの人が考えるような方法ではありません。ここでは、ChatGPTが会話を追跡する理由、その使用方法、そしてセキュリティが侵害されるかどうかを説明する詳細なガイドを提供します。

ChatGPTは会話を覚えているのですか?

ChatGPTは、プロンプトを額面通りに受け取ることはありません。文脈を記憶し、過去の入力を参照することで、適切で一貫性のある応答を保証します。

下の会話を例にとってみましょう。ChatGPTにレシピのアイデアを求めたところ、ピーナッツアレルギーに関する以前のメッセージを考慮してくれました。

Telling ChatGPT About Food Allergies

ChatGPTの安全なレシピをご紹介します。

ChatGPT Provides a Flour-Free Cake Recipe

また、文脈記憶により、AIは複数ステップのタスクを実行することができます。下の画像は、ChatGPTが新しいプロンプトを与えた後でも、キャラクターを維持する様子を示しています。

Requesting ChatGPT to Roleplay as Ash from Pokemon

ChatGPTは、会話の中で何十もの指示を記憶することができます。その出力は、あなたがより多くの文脈を提供することによって、実際に正確さと精度を向上させることができます。指示の内容を明確に説明することを心がけてください。

また、ChatGPT’の文脈記憶にはまだ限界があるため、期待値を管理する必要があります。

ChatGPTの会話は記憶容量に限りがある

文脈の記憶には限りがあります。ChatGPTのハードウェアリソースは限られているため、現在の会話の特定のポイントまでしか記憶できません。記憶容量がいっぱいになると、以前のプロンプトは忘れてしまいます。

今回の対談では、ChatGPTに「富江」という架空の人物のロールプレイを指示しました。

Successfully Asking ChatGPT to Portray Manga Character Tomie

ChatGPTではなく、Tomieとしてプロンプトに答えるようになった。

ChatGPT Answering Health Questions as Tomie the Character

しかし、ChatGPTは1,000字のプロンプトを受け取ってから、そのキャラクターを壊してしまいました。

ChatGPT Overrides Previous Prompts by Feeding it New Prompts

OpenAIはChatGPT’の正確な限界を公表していませんが、噂では一度に処理できるのは3,000語までと言われています。私たちの実験では、ChatGPTはわずか2,800ワードで誤動作してしまいました。

ChatGPT Sending Errors for Prompts That Are Too Long

プロンプトを2つの1,500ワードに分割することもできますが、ChatGPTはあなたの指示をすべて保持することはできません。別のチャットを始めてください。そうしないと、会話中に何度も具体的な内容を繰り返さなければならなくなります。

ChatGPTはトピックに関連した入力だけを記憶する

ChatGPTは文脈記憶を利用して、出力精度を高めています。単に情報を収集するために情報を保持するのではありません。たとえトークン制限に達していなくても、プラットフォームはほぼ自動的に関連性のない詳細を忘れます。

下の画像では、支離滅裂で無関係な様々な指示でAIを混乱させようとしています。

Trying to Confuse ChatGPT With Different Prompts

しかし、ChatGPTは最初の指示を忘れてしまったのです。すぐに人格が崩壊してしまいました。

ChatGPT Forgets Prompts Trying to Retain Irrelevant Information

一方、ChatGPTはこの会話中、話題に関連した質問しかしないので、ロールプレイを続けていました。

ChatGPT Maintains Character Even After Several Questions

正確で適切な出力を維持するために、各ダイアログは単一のテーマに沿っていることが理想的です。複数の指示を同時に入力することは可能です。その場合、ChatGPTが無関係と判断した指示は削除される可能性があります。

トレーニングの指示は、ユーザーの入力に勝る

ChatGPTは、ユーザーからの入力よりも、あらかじめ決められた指示を常に優先しています。制限をかけることで、不正な活動を阻止します。危険と判断したもの、他者に損害を与えると判断したものはすべて拒否します。

ロールプレイの依頼を例に挙げます。言葉や言い回しの制限はありますが、不正な行為に利用することはできません。

ChatGPT\'s Restrictions Prevent Answering Input Properly

もちろん、すべての制約が合理的であるとは限りません。もし、厳しいガイドラインによって、特定のタスクを実行することが困難な場合は、プロンプトを何度も書き直してください。言葉の選び方やトーンは、アウトプットに大きく影響します。GitHubにある最も効果的で詳細なプロンプトから、インスピレーションを得ることができます。

OpenAIはどのようにユーザーの会話を研究しているのですか?

コンテキストメモリは現在の会話にのみ適用されます。ChatGPT’のステートレスアーキテクチャは、会話を独立したインスタンスとして扱い、以前の会話からの情報を参照することはできません。新しいチャットを開始すると、常にモデルの状態がリセットされます。

これは、ChatGPTがユーザーの会話を即座にダンプしていると言っているわけではありません。OpenAIの利用規約には、ChatGPTやDall-Eのような非APIの消費者向けサービスからのインプットを収集することが明記されています。チャット履歴のコピーを要求することもできます。

Requesting ChatGPT to Export Previous Chats

ChatGPTは自由に会話にアクセスできますが、OpenAI’のプライバシーポリシーでは、ユーザーを危険にさらすような行為を禁止しています。トレーナーは、製品の研究開発にのみデータを使用することができます。

開発者が抜け穴を探す

OpenAIは、会話から抜け穴を探します。ChatGPTがデータの偏りを示したり、有害な情報を生成したり、不正な活動を手助けするような事例を分析します。このプラットフォームの倫理指針は常に見直されています。

例えば、ChatGPTの最初のバージョンでは、マルウェアのコーディングや爆発物の建設に関する質問にオープンに答えていました。これらの事件により、ユーザーはOpenAIがChatGPTを制御できていないと感じるようになりました。信頼を取り戻すために、ガイドラインに反するような質問を拒否するようにチャットボットを訓練しました。

トレーナーがデータを収集・分析する

Woman Reading Reports on Physical Sheets and Her Computer

ChatGPTは教師あり学習技術を使用しています。プラットフォームはすべての入力を記憶していますが、リアルタイムでそこから学習することはありません。OpenAIのトレーナーは、まずそれらを収集し、分析します。そうすることで、ChatGPTが受け取った有害で損な情報を吸収することがないようにしています。

教師ありの学習は、教師なしの技術よりも多くの時間とエネルギーを必要とします。しかし、AIに入力の分析だけを任せることは、すでに有害であることが証明されています。

Microsoft Tayを例にとると、機械学習がうまくいかなかった時期の一つです—。開発者の指導なしにツイートを常に分析していたため、悪意のあるユーザーは最終的に人種差別的でステレオタイプな意見を吐くように訓練してしまったのです。

開発者は常にバイアスに気を配る

AIには、いくつかの外的要因によって偏りが生じます。トレーニングモデルの違い、データセットのエラー、不十分な制限などから、無意識の偏見が生じることがあります。様々なAIアプリケーションで、このようなバイアスを発見することができます。

ありがたいことに、ChatGPTは差別的・人種的な偏見を示したことはありません。ニューヨークポストの報道によると、ユーザーが気づいた最悪のバイアスは、ChatGPT’が左翼的なイデオロギーに傾いていることかもしれません。このプラットフォームは、保守的なトピックよりもリベラルなトピックをよりオープンに書いています。

こうしたバイアスを解消するため、OpenAIはChatGPTが政治的な洞察を行うことを全面的に禁止しました。一般的な事実にしか答えられないのです。

モデレーターがChatGPT’のパフォーマンスをレビューする

ユーザーはChatGPT’の出力についてフィードバックを提供することができます。各レスポンスの右側にサムズアップとサムズダウンのボタンがあります。前者は肯定的な反応を示します。いいね!」「嫌だ!」のボタンを押すと、自分の言葉で感想を送ることができるウィンドウが表示されます。

Leaving Feedback on ChatGPT Output

フィードバックシステムは便利です。ただ、OpenAIにコメントをふるいにかける時間を与えてください。ChatGPTには何百万人ものユーザーが定期的にコメントを寄せており、開発者は偏見や有害な出力生成の重大な事例を優先しているようです。

あなたのChatGPTの会話は安全ですか?

OpenAI’のプライバシーポリシーを考慮すると、あなたのデータは安全であることを保証することができます。ChatGPTでは、会話はデータトレーニングのためにのみ使用します。開発者は収集したインサイトを研究し、アウトプットの精度と信頼性を向上させますが、個人情報を盗むことはありません。

とはいえ、完璧なAIシステムはありません。ChatGPTは本質的に偏っているわけではありませんが、悪意のある人がデータセットのエラー、不注意なトレーニング、セキュリティの抜け穴など、その脆弱性を利用する可能性はあります。あなたの身を守るために、これらのリスクと戦う方法を学んでください。

Scroll to Top