ChatGPTはユーザーの会話から学んでいるのか？

何百万人ものChatGPTユーザーがいる中で、OpenAIはその会話全てをどう処理しているのだろうと思うかもしれません。ChatGPTで話していることを常に分析しているのでしょうか？

ChatGPTはユーザーの入力から学習しますが、多くの人が考えるような方法ではありません。ここでは、ChatGPTが会話を追跡する理由、その使用方法、そしてセキュリティが侵害されるかどうかを説明する詳細なガイドを提供します。

ChatGPTは会話を覚えているのですか？

ChatGPTは、プロンプトを額面通りに受け取ることはありません。文脈を記憶し、過去の入力を参照することで、適切で一貫性のある応答を保証します。

下の会話を例にとってみましょう。ChatGPTにレシピのアイデアを求めたところ、ピーナッツアレルギーに関する以前のメッセージを考慮してくれました。

ChatGPTの安全なレシピをご紹介します。

また、文脈記憶により、AIは複数ステップのタスクを実行することができます。下の画像は、ChatGPTが新しいプロンプトを与えた後でも、キャラクターを維持する様子を示しています。

ChatGPTは、会話の中で何十もの指示を記憶することができます。その出力は、あなたがより多くの文脈を提供することによって、実際に正確さと精度を向上させることができます。指示の内容を明確に説明することを心がけてください。

また、ChatGPT’の文脈記憶にはまだ限界があるため、期待値を管理する必要があります。

ChatGPTの会話は記憶容量に限りがある

文脈の記憶には限りがあります。ChatGPTのハードウェアリソースは限られているため、現在の会話の特定のポイントまでしか記憶できません。記憶容量がいっぱいになると、以前のプロンプトは忘れてしまいます。

今回の対談では、ChatGPTに「富江」という架空の人物のロールプレイを指示しました。

ChatGPTではなく、Tomieとしてプロンプトに答えるようになった。

しかし、ChatGPTは1,000字のプロンプトを受け取ってから、そのキャラクターを壊してしまいました。

OpenAIはChatGPT’の正確な限界を公表していませんが、噂では一度に処理できるのは3,000語までと言われています。私たちの実験では、ChatGPTはわずか2,800ワードで誤動作してしまいました。

プロンプトを2つの1,500ワードに分割することもできますが、ChatGPTはあなたの指示をすべて保持することはできません。別のチャットを始めてください。そうしないと、会話中に何度も具体的な内容を繰り返さなければならなくなります。

ChatGPTはトピックに関連した入力だけを記憶する

ChatGPTは文脈記憶を利用して、出力精度を高めています。単に情報を収集するために情報を保持するのではありません。たとえトークン制限に達していなくても、プラットフォームはほぼ自動的に関連性のない詳細を忘れます。

下の画像では、支離滅裂で無関係な様々な指示でAIを混乱させようとしています。

しかし、ChatGPTは最初の指示を忘れてしまったのです。すぐに人格が崩壊してしまいました。

一方、ChatGPTはこの会話中、話題に関連した質問しかしないので、ロールプレイを続けていました。

正確で適切な出力を維持するために、各ダイアログは単一のテーマに沿っていることが理想的です。複数の指示を同時に入力することは可能です。その場合、ChatGPTが無関係と判断した指示は削除される可能性があります。

トレーニングの指示は、ユーザーの入力に勝る

ChatGPTは、ユーザーからの入力よりも、あらかじめ決められた指示を常に優先しています。制限をかけることで、不正な活動を阻止します。危険と判断したもの、他者に損害を与えると判断したものはすべて拒否します。

ロールプレイの依頼を例に挙げます。言葉や言い回しの制限はありますが、不正な行為に利用することはできません。

$ChatGPT\'s Restrictions Prevent Answering Input Properly$

もちろん、すべての制約が合理的であるとは限りません。もし、厳しいガイドラインによって、特定のタスクを実行することが困難な場合は、プロンプトを何度も書き直してください。言葉の選び方やトーンは、アウトプットに大きく影響します。GitHubにある最も効果的で詳細なプロンプトから、インスピレーションを得ることができます。

OpenAIはどのようにユーザーの会話を研究しているのですか？

コンテキストメモリは現在の会話にのみ適用されます。ChatGPT’のステートレスアーキテクチャは、会話を独立したインスタンスとして扱い、以前の会話からの情報を参照することはできません。新しいチャットを開始すると、常にモデルの状態がリセットされます。

これは、ChatGPTがユーザーの会話を即座にダンプしていると言っているわけではありません。OpenAIの利用規約には、ChatGPTやDall-Eのような非APIの消費者向けサービスからのインプットを収集することが明記されています。チャット履歴のコピーを要求することもできます。

ChatGPTは自由に会話にアクセスできますが、OpenAI’のプライバシーポリシーでは、ユーザーを危険にさらすような行為を禁止しています。トレーナーは、製品の研究開発にのみデータを使用することができます。

開発者が抜け穴を探す

OpenAIは、会話から抜け穴を探します。ChatGPTがデータの偏りを示したり、有害な情報を生成したり、不正な活動を手助けするような事例を分析します。このプラットフォームの倫理指針は常に見直されています。

例えば、ChatGPTの最初のバージョンでは、マルウェアのコーディングや爆発物の建設に関する質問にオープンに答えていました。これらの事件により、ユーザーはOpenAIがChatGPTを制御できていないと感じるようになりました。信頼を取り戻すために、ガイドラインに反するような質問を拒否するようにチャットボットを訓練しました。

トレーナーがデータを収集・分析する

ChatGPTは教師あり学習技術を使用しています。プラットフォームはすべての入力を記憶していますが、リアルタイムでそこから学習することはありません。OpenAIのトレーナーは、まずそれらを収集し、分析します。そうすることで、ChatGPTが受け取った有害で損な情報を吸収することがないようにしています。

教師ありの学習は、教師なしの技術よりも多くの時間とエネルギーを必要とします。しかし、AIに入力の分析だけを任せることは、すでに有害であることが証明されています。

Microsoft Tayを例にとると、機械学習がうまくいかなかった時期の一つです—。開発者の指導なしにツイートを常に分析していたため、悪意のあるユーザーは最終的に人種差別的でステレオタイプな意見を吐くように訓練してしまったのです。

開発者は常にバイアスに気を配る

AIには、いくつかの外的要因によって偏りが生じます。トレーニングモデルの違い、データセットのエラー、不十分な制限などから、無意識の偏見が生じることがあります。様々なAIアプリケーションで、このようなバイアスを発見することができます。

ありがたいことに、ChatGPTは差別的・人種的な偏見を示したことはありません。ニューヨークポストの報道によると、ユーザーが気づいた最悪のバイアスは、ChatGPT’が左翼的なイデオロギーに傾いていることかもしれません。このプラットフォームは、保守的なトピックよりもリベラルなトピックをよりオープンに書いています。

こうしたバイアスを解消するため、OpenAIはChatGPTが政治的な洞察を行うことを全面的に禁止しました。一般的な事実にしか答えられないのです。