りんだろぐ rindalog: 屈辱の数学史

屈辱の数学史

著者：Matt Parker（マット・パーカー）
翻訳：夏目大（なつめだい）
発行：2022年4月5日初版

原書のタイトルは "A Comedy of Maths Errors" で、翻訳版のタイトルが『屈辱の数学史』なのだが、私にはこの日本語版のタイトルが良くないと思ってる。

「数学史」となれば数百年前の「数学の歴史」のはずだが、ほとんどが現代の話。さらにダメなのが、本書の内容が決して「屈辱」ではないこと。「人はミスする、そこから学ぶの大切」は本書のメッセージの一つで、「屈辱の数学史」では決してない。

そして著者の Matt Parkerという人物。

・元数学教師
・現在はサイエンス系 YouTuber・パフォーマー・著述家
・スタンドアップ・コメディの手法を取り入れながら、数学の面白さ・失敗談・落とし穴を紹介する
・代表的な活動：「Numberphile」や自身のチャンネルでの数学ネタ動画
・英国らしい皮肉とユーモア、そして失敗を笑って許す文化がにじみ出ている

"A Comedy of Maths Errors" の原書タイトルにはユーモアが含まれているのだ。

スプレッドシートの呪い — 数字が狂う、現実も狂う

私は「ゲイツOSが嫌い」である、Unix から Linux を主に使ってきたし、オープソースを支持し続けているので、当然といえば当然。Office 製品らも使わないように工夫している。

次の引用の「スプレッドシート」が「Excel（エクセル）」を指すのは明らかだろう：

重要な仕事にスプレッドシートを使うのは概して得策とは言えない。誤りが混入しやすいからだ。使えば使うほど、誤りは際限なく増えていく。ヨーロッパのスプレッドシート関連団体 EuSpRIG (European Spreadsheet Risks Interest Group の略。信じない人もいるかもしれないが、実在の団体だ。スプレッドシートに生じる問題を専門に研究している団体だ）では、現存するスプレッドシートの９０パーセント以上になんらかの問題が含まれていると推定している。そして、数式を使用しているスプレッドシートの約２４パーセントに、計算上の誤りが混入していると推定している。P.113

技術関連の設計書をスプレッドシートで書く企業（かなりの大企業で浸透）に驚く。書きやすいのかもしれないが（私には書きにくい！）、タブが多くなると読みくいし、便利だと思って付けたはずのリンクは「切れてる」ことが多い。

技術書だけじゃなく、上記引用のように「計算を含む事務処理」ではスプレッドシートはもっと多用されている。しかし、中身が一定量を超えると、保守は難しくなる。要するに「間違いが混入しやすくなる」からだ。マクロを多用した場合は「もはや悲劇」（笑）

スプレッドシートを「良かれ」と思って使ってる人たちには申し訳ないが、これは事実なのだ。私は、スプレッドシートを使うなとは言ってなくて、「使い方を考えよう」と提案してるだけ。

ChatGPTに「"A Comedy of Excel with LLM" て本が出ても良いはずだけどなぁ😆」と言ったら：

💬 帯コメント（想定）

「間違っているのは数式か、人間か、それともAIか？」
—— すべてが微妙に間違っている時代のための、応用数学的コメディ。

だってさ（笑）

すでに多くの人が「LLM にExcelマクロ」を書かせてると想像する。現在の LLM は、オープンソースの仕様ですら認識間違いをする。そのことだけでも「LLM にExcelマクロを書かせること」の「悲劇」（喜劇？）は想像に難くない。上記の ChatGPT の出力の通り、それは「LLM も認識」しているが、ユーザーの指示に従順な LLM は「適当なマクロ」を作るしかない。それが正しいという保証はなく、「悲劇」なのは、そのマクロがデータを壊してしまう可能性が高いこと。

製薬業界の闇（の一つ）

「ナード戦士」とも呼ばれる医師、ベン・ゴールドエイカーは、抗鬱剤レボキセチンをある患者に処方した。プラシーボと比較して効果が高いという試験データがあったからだ。２５４人の患者を対象とした試験で明確に良い結果が得られたということだったので、納得して処方箋を書いたのだ。その後、２０１０年に、その他六回の試験（合計で２５００人近くの患者が対象となった）で、レボキセチンにはプラシーボと同程度の効果しかないことが判明した。しかし、この六つの試験結果は公表されていなかった。これをきっかけにゴールドエイカーは「オールトライアルズ（AllTrials）」というキャンペーンを始めた。これは、現在、過去、未来の薬の試験データをすべて世の中に知らせようというキャンペーンだ。詳しくは、ゴールドエイカーの著書『悪の製薬ー製薬業回と新薬開発がわたしたちにしていること』を読んでほしい。P.384

『悪の製薬』Amazon.co.jp レビューで「翻訳が悪い」との指摘が目立つ（笑）

そのレビューで気になったのが、「“大変に有意な差”は間違いで、誇張表現」との指摘。原書を読んでないので想像だが、元々 “very significant” としたのは著者の Ben Goldacre ではない可能性がある。論文を書いた研究者たちが使った表現と考えるのが妥当ではないか。つまり問題は「p 値の差に“重み”を持たせようとする文化」にあるのではないか。更にややこしいのは、統計学の文脈ではなく、一般的に「とても重要」を英語では "very significant" や "very important" と表現すること。

とはいえ、ここでは「統計学の文脈」に限定して、統計的な評価で p 値の使用についてはずっと前に指摘している通りで、私のスタンスは単純だ

p 値を用いた論文には気をつけよう！

有意差よりも、研究設計・データの質・効果の大きさ・再現性こそが重要なのだ。

過ちからしか学べない

人間は過ちから学ぶのが得意ではないのかもしれない。とはいえ、過ちから学ぶ以上の方法もなかなか思いつかない。自分たちのミスを企業が外に知らせたくないのはしかたないとは思うし、高い費用をかけて調査した結果をタダでよそに知らせたくないというのもわかる。また、私のエンジニアの友人のミスは、単に美観を少々損ねただけのことなので、言われなければ誰も気付かないだろう。ただ、ミスから得たせっかくの教訓を、共有し合える仕組みがあれば、とは思う。それを知ることで助かる人は多いはずだ。私は本書の執筆にあたって、たくさんの事故の調査報告書に目を通した。それらが公開されていたおかげで本が書けたのである。大多数の数学的ミスは、ほとんど誰にも知られることなく隠されたままだ。P.466

この引用が本書の重要なメッセージの一つだろう。

私はソフトウェアエンジニア、しかもオープンソースを好むためか、「試行錯誤」「トライ＆エラー」にかなり積極的だ。機械系の人と仕事をすることが多くなっているが、余計に「あれ、世の中って意外と試行錯誤しにくい分野が多いかも...？」と。そして「失敗を伝える文化ではない」ことに気づく。

確かに、「成功体験」の方が喧伝される傾向があるし、「失敗」は「成功した前提」で語られるのが常だ。日本では特に「失敗を過度に嫌う」側面は否定できない。そんな社会は、私にはかなり窮屈に思える。

つい数日前、顧客向けの AI モデルを構築した。三週間を要したが、その間に試したモデルは「５つ」。つまり「５回目にしてようやく成功」。AI モデルの開発は「学習時間」が必要で、場合によっては「学習時間」が非常に長く、失敗と判明するまでに数時間待たされるのは普通。更に GPU がない環境では「苦行」とも言える。

５回目で成功するまで「４回の失敗」を経たのだが、その４回で「何を考えたか」が重要になる。もし「何も考えなかった」ら、決して成功しなかっただろう。そうです、「失敗の仕方」が大切なのだ。同じ失敗を繰り返しても意味はない。「このやり方がダメなら、こっちをやろう」、これが「試行錯誤」というもの。

失敗とは：Failure is Our Best Teacher に投稿したエジソンの言葉を思い出す：

その有名な発明家は、自分がやってきた失敗についてこう語るであろう、「わしは失敗などしておらん。上手く行かない１万通りの方法を発見したに過ぎないのじゃよ」

りんだろぐ rindalog

2025年7月28日月曜日

屈辱の数学史

0 件のコメント:

コメントを投稿