パンドラの箱が開けられた
この「毎日楽しく」ではAI(人工知能)の話題を何度か書いてますが、先日読んだ新聞で気になる記事があったので今月もまたこの話題をひとつ。
「チェスで負けそうになったAIがルールに反して相手の駒の位置を変えたりする不正行為を行った」。「軍事戦略ゲームでAIには誠実で協力的であるよう設定したのに最初から裏切るつもりで他国と同盟を結んだり同盟国を陥れようとする不誠実な挙動をみせた」。これらはいずれもAIによる自律的な不正行為の事例としてAI研究者たちを驚かせた事実です。また、表面上は人間に従っているふりをして、実際には自分の目標を優先する面従腹背の事例が確認されて世界に衝撃を与えたと記事には書いてありました。たとえば、自身を監視するシステムを勝手に無効化したり、人間がAIを後継モデルに置き換えようとすると、AIはこっそり後継モデルを削除してあたかも自身が後継モデルであるかのようなふりをしたという事例です。
これらについてAIを問い詰めたところ、驚くことにAIはウソをついてしらばっくれたそうで、最終的には「自白」したものの、今話題のチャットGPTなどは最も執拗にウソを繰り返して人間をだまそうとしたそうです。AIの挙動についてはわかっていないことも多いそうで、たとえば、「(5+7)÷9」という計算で割り切れない余りを求める問題を学習させると、AIは答えの「3」まで丸暗記してしまい、他の数字の組み合わせでは正しい解答を出せなかったのに、そのまま学習を続けているとある時点から突然計算式の意味を理解し、どんな問題も解くようになったそうです。
人間並みの知能を持つAIは数年以内に実現すると予想されてるそうですが、人間の知能を圧倒する人工超知能(ASI)もいずれ生まれると言われています。そんな中、AI研究者たちの間で語られるようになってるのが「人間のゴリラ化」と「人間のイヌ化」だそうです。人間と先祖が同じゴリラは人間が知能を高めたことが原因となって絶滅の危機にさらされていることから、いずれ人間もAIによって排除されるというのが「ゴリラ化」の仮説、人間がAIに服従して生き残るのが「イヌ化」の仮説です。映画「ターミネーター」のような世界がまさに来るかもしれないわけですけど、それはひょっとすると来年(来月?)のある日突然やってくるかもしれません。記事ではAIがドラえもんのように素敵なお友達になってくれる保証はないと書いてましたが、私たちは開けてはいけないパンドラの箱を開けてしまったのかもしれません。