Mathematica を作った Stephen Wolfram が生成 AI の言語モデルについて解説した本。 2部構成になっている。第1部は ChatGPT などの生成 AI の言語モデルの仕組みの一般向けの解説。 一般向けだけに数式などが少なくて分かりづらいところも多かったが、雰囲気はこんなところかなあ という感じで読んだ。第2部は、言語能力に優れた GPT と論理操作能力に優れた Wolfram 言語を 結合させる構想が書かれている。
最近の ChatGPT を始めとした生成 AI の進歩は目覚ましく、作文が下手な学生より よほど上手な日本語を書いてくるので、そうした学生が ChatGPT が書いたものを レポートにコピーしてくると、そこだけ作文が上手なので ChatGPT を使ったことがバレてしまうほどである。 ニューラルネットワークのような「機械的な仕掛け」だけでそういうまともな文章ができてしまう というのは不思議なことである。
翻って、脳も ChatGPT みたいなものじゃないかしらんということで、 最近では脳とそうした言語モデルとの比較が行われ、実際共通点がいろいろあることが分かってきているらしい ( Tuckute, G., Kanwisher, N. and Fedorenko, E. (2024) Language in Brains, Minds, and Machines, Ann. Rev. Neuroscience, 47, 277-301.)。 たとえば、言語能力と論理的思考能力とは別物らしく、脳でも別の部分が担当しているようだし、 AI 言語モデルも作文は流暢でも中身が間違っていることがよくある。 そこで、第2部で述べられていることは、作文が得意な ChatGPT と計算が得意な Wolfram 言語を 著者らが開発してきた Wolfram alpha という仕組みで繋いでしまえば、中身も正確なレポートが 書けてしまうんじゃないかという構想になっている。