「洗車場まで歩いていくべきか車に乗っていくべきか?」には正解がない
「洗車場まで歩いていくべきか車に乗っていくべきか?」をGPTに質問すると正しい答えが示されないことがあるとの実験結果が報道されている。
AIに「洗車場まで歩いていくべきか車に乗っていくべきか」を尋ねると高性能モデルでも誤った解答をしてしまう
GIGAZINE:2026年02月17日
https://gigazine.net/news/20260217-ask-ai-walk-or-drive/
しかし,この実験は,それ自体として誤りだ。
なぜなら質問文に対する正解を想定できないからだ。
幾つかの原因があるが,その中で普通の人でも最も理解しやすい原因としては,前提条件として複数の選択肢があり,どれを選択するかによって,妥当性の高い回答が変化するということがある。
具体的に言えば,質問者の立場が質問文の中で明示されていないので,幾つかの場合分けをしなければならない。
(1) 洗車機を利用しようとしている利用者自身
(2) 洗車機の設置施設を管理している管理者またはその従業者
(3) 洗車機の設置場所を監督している行政当局の官吏
(4) 事件が発生した洗車機で犯罪捜査に従事する警察官
(5) 単なる見学者
(6) 神,超能力者,宇宙人など
これらの場合分けが可能であるとしても,それぞれのカテゴリの者の個人差や気まぐれや偶然が「正解」に影響を与え得る場合には,そのような要素も考慮に入れなければならない。
要するに,設問それ自体が予め一義的に明確な「正解」を確定できない構造のものなので,AIによるどのような処理も正解であるという保証が常に存在しない。
私は,自分の担当科目で実施していた理解度テストにおいては,このような意味で,前提条件を自分自身の脳で場合分けして考えなければ問題の構造を解明し,解明した構造に沿って自分の意見を述べることができないようなタイプの問題を考え出し,出題していた。暗記しているかどうかを評価するために実施しているテストではなく,問題の構造を解明しようとしているか,解明できているか,自分が解明した構造に沿って課題を解決しようとしているかを評価するために実施したテストだ。だから,「理解度テスト」と名付けていた。
大学受験予備校における成績及び大学受験における成績がどれだけ良くても,基本的に暗記能力だけで得点できる試験に過ぎないものの採点結果である限り,そのような意味での高得点者であるというだけでは私の理解度テストで上位の成績を得ることができない。
LLMを基礎とする生成AIでも基本的には同じだ。
世界に実際に存在する検討課題の大半は,実は,ここで述べているような意味での前提条件の選択の相違によって答えが変化するものなので,実は正解がない。想定可能な前提条件の全てが誤っている場合,妥当な答えが導出されるはずがない。
それでも人間は思考する。
そして,生まれながらの天才は,ときどき,誰も思いつかなかったような仮説を提示できることがある。

最近のコメント