LLMにおける自動的かつ無差別なデータ収集を利用した世論操作
ナチスのゲッペルスは,「嘘も100回言えば真実になる」と述べたということになっている。
同じことは中国の古典の中でも何度も出現する。毛沢東もそれを学び,そのとおりに実行することによって蒋介石に対する人民解放軍の勝利を得た。その蒋介石もまた抗日戦において同じことをやった。
第二次世界大戦や国共内戦は遠い昔のことになってしまったのだが,インターネットが普及している現代社会においても,政治問題や国際問題に関する虚偽内容の公式声明がほぼ日常的にどこの国からも出される。
ところで,LLMを基礎とするAIシステムは,インターネット上にあるそれらの虚偽内容の公式声明も大量に学習し続ける。
最も愚かなAIシステムでは,類似の表現をもつデータの出現頻度によって「確からしさ」を統計学を基礎として算出する。算出された数値が高ければ「真(true)」である確率が高いと評価される。しかし,それは,明らかに誤りだ。
ここにおいてもまた,意味論や価値判断が関係する分野においては,統計学の応用がいかに危険で愚かなことかが示されていると言える。
***
真に賢い者が確率計算によって判断することはない。
| 固定リンク

コメント