2015年10月1日木曜日

ベイズの基礎:Why Bayes?

Why Bayes? の前に」からの続き。

ここでは、テキスト Workshop Statistics: Discovery with Data, A Bayesian Approach (James H. Albert and Allan J. Rossman May 23, 2009) の序文の意訳を試みた。

Workshop Statistics: Discovery With Data, a Bayesian Approach (Workshop Statistics Series)
James H. Albert Allan J. Rossman
Key Curriculum Pr
売り上げランキング: 1,554,240

200年の歴史があるベイズは、現代において更に見直され、様々な拡張がなされている。そんなベイズを、当然のこととして、本テキストだけで全てを学ぶことは不可能。ただ、私がベイズに取り組み出した当初、いきなり「ベイズのルール」を使うことから始めた過ちと比較して、本テキストから始めるのは圧倒的に有効だ。学び方が逆になってしまった私は、余計に本テキストの素晴らしさを痛感している。

そんなテキストの序文をここでは翻訳した。序文の要約は

統計学の初学者は、頻度主義者の豊富な統計学の手法よりも、唯一ベイズのルールを学ぶ方が容易で、統計学の科学的手法を学ぶのに適している。

このことに既に納得される方には、本序文は不要だろう。


翻訳の前に

こんな風に全文訳はしたくはないのだが、より理解するために自分の解釈を入れながら意訳して、「ベイズとは?」「何故ベイズなのか?」の基本的な理解を目指した。原文は平易なので簡単に読めたが、いざ全文訳になると、日本語の選択に大いに悩んだ。予想以上に時間を要したが、原文の意図を深く理解できたので、その悩みは報われたとしたい。

もっと極端な意訳で、もっと「軽い表現」にすることも考えたが、本テキストは統計学の初学者の学生に向けたものなので「フラットな表現」をこころがけた。漫画やイラストなどを多用しても、必ずしも分かり易くはならないし、逆に誤解を生む可能性もあるので、文章だけの分かりやすい訳に努めた。

原文は掲載するつもりはなかった。しかし、私の翻訳ミスもあるだろうし、原文に興味がある人に向けて、掲載することにした。こんな原文と訳の並記なんて、日本の書籍ではあまり見られない、面白い試みと思いやってみた。自分の翻訳のダメさを晒すようだが気にしない。私の意訳の意図など、気付いて頂ければ幸いだ。

とはいえ、本テキストに興味を持たれた方は、是非とも原文をお勧めします。書籍版の購入も可能だが、PDFファイルが公開されています。書籍との違いは不明ですが、ネット版のものでも十二分に有益です。

翻訳文の中で、「95% confidence 95%の確信」のように、原文の英語と訳を鍵カッコで表記しているのは、日本語として不適切な可能性があるもの。統計学用語として対応する日本語訳もあるのかもしれないが、それらの多くを無視した、parameter を母数」と訳された弊害を考慮したから。できれば、これらの用語は英文でイメージして頂きたい。それでも「the prior」を「事前確率」としたように、できる限りの日本語表記も心がけた。

ここで書かれていることを知らないで、現代のデータ分析は語れないと確信する。頻度主義者の統計学がベイジアンに置き換わる可能性は定かではない。正直「頻度主義者の統計学 vs. ベイジアン」の論争に興味はない。しかし確信を持って言えるのは、200年の歴史を持つベイジアンが、これから数十年の内に否定されるとは考え難い。むしろ、ベイズのルールに新たな分析手法が加わり、更に見直される可能性の方が高いと信じている。「頻度主義者の統計学」にも同様の可能性があるのは言うまでもない。

なお、原文の強調表記は私が行ったもの。


Workshop Statistics: Discovery with Data, A Bayesian Approach
PREFACE


伝統的な統計的推定の紹介
Traditional Method of Introducing Statistical Inference 

統計学的推定は、伝統的に頻度主義者の手法を用いて教えられている。この手法を解説するため、ある大学の全学生を対象に、定期的にコーヒーを飲む人の「割合の算出」を試みる。無作為に選んだ100人の学生に「定期的にコーヒーを飲みますか?」と尋ね、飲む人の割合を算出。その結果は 21% (21/100) となったとする。この結果から、すべての学生でコーヒーを飲む割合をどう解釈できるか?
Statistical inference is traditionally taught using the frequentist approach. To illustrate this approach, suppose one is interested in learning about the proportion of all undergraduate students at a particular college who drink coffee regularly. One learns about this unknown proportion by taking a random sample of 100 students, asking each student if they drink coffee regularly, and computing the proportion of students who drink coffee in the sample. Suppose that this sample proportion is 21/100 = .21. Based on this data, what have we learned about the proportion of all undergraduates who drink coffee?

頻度主義者の推定手法は、標本分布という考えに基づく。母集団である大学生から100人の標本を繰返し抽出して、各標本における「コーヒーを飲む人の割合」を算出する。全標本の割合の集合は「求める割合の標本分布」と呼ぶ。そんな標本分布の形、平均、標準偏差から、調査対象の割合の「confidence interval confidence区間」を導き、そして「the location of the proportion 求める割合の位置」を決定する。
The frequentist approach to inference is based on the concept of a sampling distribution. Suppose that one is able to take samples of size 100 repeatedly from the population of undergraduates and compute the sample proportion for each sample selected. The collection of proportions from all of the samples is called the sampling distribution of the proportion. The knowledge of the shape, mean, and standard deviation of this sampling distribution is used to construct confidence intervals for the proportion of interest, and to make decisions about the location of the proportion.

伝統的な推定手順を正確に理解するには、標本分布の考え方を理解する必要がある。通常は、たった一つの標本でデータ分析しようとする。しかし、もし母集団から無作為に標本を数多く抽出できたとしたらどうなるか、を考える必要に迫られる。実際のところ、推定区間の「95% confidence 95%の確信」とは、標本を母集団から繰返し抽出した際の「the behavior of the statistical procedure 統計学的手順としての慣習」のことである。
To correctly interpret traditional inferential procedures, students need to understand the notion of a sampling distribution. The students will analyze only one sample in their data analysis. But he or she has to think what could happen if we took a large number of random samples (like the one just selected) from the population. Indeed, a statement such as “95% confidence” for an interval estimate refers to the behavior of the statistical procedure when samples are repeatedly taken from the population.

ベイジアンの視点
The Bayesian Viewpoint

推定ついてベイジアンの視点は「the subjective interpretation of probability 確率の主観的解釈」に基づく。先の例では、学生がコーヒーを飲む割合は不明として、「the location of this proportion その割合の位置」に関する「a person's belief 確信」を表すものとして確率分布がある。この確率分布は「the prior 事前確率」で、データ収集前の割合に関する「分析者の認識」。標本抽出してデータ観測後、求める割合の確信が変化することになる。ベイズのルールとは、事前確率分布と標本データから、求める割合の新しい確率分布を算出するレシピである、この新しい確率分布を「the posterior 事後確率」と呼ぶ。求める割合の全ての推定は、「appropriate summaries of the posterior probability distribution 事後確率分布の適切な要約」から成される。
The Bayesian viewpoint toward inference is based on the subjective interpretation of probability. In our example, the proportion of undergraduates drinking coffee is an unknown quantity, and a probability distribution is used to represent a person’s belief about the location of this proportion. This probability distribution, called the prior, reflects a person’s knowledge about the proportion before any data is collected. After the sample survey is taken and data are observed, then one’s opinions about the proportion will change. Bayes’ rule is the recipe for computing the new probability distribution for the proportion, called the posterior, based on knowledge of the prior probability distribution and the sample survey data. All inferences about the proportion are made by computing appropriate summaries of the posterior probability distribution.

ベイズのルールを統計学の授業の導入で使う場合、生徒は基本的な確率について学ぶ必要がある。本テキストのトピック 11, 12, 13 で、確率と算出方法、確率テーブルについて述べる。条件付確率を「two-way 確率テーブル」を使ってトピック 14 で取り上げる。「two-way 確率テーブル」はトピック 15 でベイズのルールの紹介でも用いる。トピック 15 で使う基本的な方法論は、トピック 16, 17, 18, 19, 21 にかけて、割合、平均、そして二つの割合の推定問題に発展することになる。
To use Bayes’ rule in an introductory statistics class, the student needs to learn some basic probability concepts. Topics 11, 12, 13 discuss the interpretation of probabilities and methods of computing and interpreting probability tables. Conditional probability is introduced in Topic 14 by means of a two-way probability table, and this two-way table is used in Topic 15 to introduce Bayes’ rule. The basic methodology used in Topic 15 is extended to problems of inference for one proportion, one mean, and two proportions in Topics 16, 17, 18, 19, and 21.

なぜ伝統的な手法じゃダメなのか?
Why Not the Traditional Approach?

伝統的な手法で統計学的推定を教えることは、実際に使用されている良く知られた手法に繋がるのだが、初期段階で学ぶには難しいかもしれない。標本分布の考え方は最も難しいものだろう。生徒に求められのは「標本の散らばり具合」を考えることであって、生徒が観測したことではないのだ。もし生徒が、標本分布に固有の「the repeated sampling idea 標本抽出を繰返すという考え方」を十分理解できない場合、彼らは、例えば「その割合はこの区間にあると 95% で確信する」というように、伝統的推定結果を正しく理解できないだろう。「伝統的推定の考え方」を学ぶのは難しいので、指導者は「考え方」ではなく、統計学的推定の「技巧」を教えるのに終始してしまうだろう。その技巧には多様な統計学的レシピの使用方法、統計学ソフトウェアを使ったレシピの正しいブログラミングが含まれる。この手の教え方は「料理本」的な授業。そんな教え方は「現代の統計学教育」に反している。そこでは、初期の授業においては、少ないレシピで深い考察を推奨している。
Although the traditional approach to teaching statistical inference leads to the familiar methods used in practice, it can be difficult to learn in a first course. The notion of a sampling distribution is perhaps the most difficult concept, since the student is asked to think about the variation in samples other than the one that he or she observed. If the student does not fully understand the repeated sampling idea that is inherent in a sampling distribution, then he or she will not be able to correctly interpret traditional inferential conclusions like “I am 95% confident that the proportion is contained in my interval.” Since the traditional inferential concepts are hard to learn, the instructor may focus on teaching the mechanics of statistical inference instead of the concepts. These mechanics include the use of a variety of statistical recipes and the correct programming of these recipes using a statistics computer package. This type of “cookbook” class is counter to the modern movement in statistics instruction which encourages more thinking in a first class and fewer recipes.

何故ベイズなのか?
Why Bayes?

ベイジアンの視点には、統計学の授業の導入で教えると、生徒たちに興味を抱かせるいつかの特徴がある。
The Bayesian viewpoint has several features that make it especially attractive in the teaching of an introductory statistics class.

仮定的推定 全てのベイジアン推定の結果は、観測データに基づいて「仮定的」である。伝統的な手法と異なり、観測したものを除いて、データの集合について考えない。ベイジアンの手法では、標本分布について考える必要はないのです。
Conditional inference. All Bayesian inferential conclusions are made conditional on the observed data. Unlike the traditional approach, one need not be concerned with datasets other than the one that is observed. There is no need to discuss sampling distributions using the Bayesian approach.

理解しやすい推定結果 ベイジアンの視点から、次のように確率を語ることは合理的である。求める割合が「10% から 30%」のように特定の範囲にある確率、もしくは「仮説が真である確率」。これら推定結果は、一般的に生徒たちの直感に反しない。逆に、伝統的な推定結果は往々にして誤ったものになる。例えば、伝統的な推定区間が「10% から 30%」とすれば、生徒は「90% の確率で、10% から 30% の区間に求める割合がある」と誤るのが通常だ。(伝統的な視点で)確率というものが、「the behavior of the interval estimate under repeated sampling 繰返した標本抽出による見積値の区間という慣習」ということを、生徒は忘れてしまうのだ。
• Inferential conclusions are understandable. From a Bayesian viewpoint, it is legitimate to talk about the probability that the proportion falls in a specific interval, say (.1, .3), or the probability that a hypothesis is true. These inferential conclusions are generally the ones that seem intuitive for the students. In contrast, traditional inferential conclusions are frequently misstated. For example, if a computed traditional confidence interval is (.1, .3), it is common for the student to incorrectly state that the proportion falls in the interval (.1, .3) with probability .90. The students forget that the probability (in a traditional viewpoint) refers to the behavior of the interval estimate under repeated sampling.

レシピは一つ ベイズのルール、これだけが学ぶ必要がある、たった一つの推定方法。事後確率分布をベイズのルールで算出すれば、後は単に確率分布を要約するだけで推定は完了する。
• One recipe. Bayes’ rule is really the only inferential method that needs to be taught. Once Bayes’ rule is used to compute the posterior distribution, the student just needs to summarize this probability distribution to make inferences.

科学的手法の利用 統計学クラスの導入時における目標の一つは、統計学者がいかにして科学的手法を使って答えを導くか学ぶこと。科学的手法において、ある出来事に関する仮定や理論をもって開始して、そして問題に関係するデータ集めて、そのデータに従い理論は見直される。ベイジアンの視点は、科学的手法の実践に有効な理論的枠組みを与えてくれる。「対象の母集団についての当初の確信」である事前確率分布から始まり、関係する標本データを集めて、集めたデータが示す母集団に関する「確信」である「事後確率分布」を求める。
• Illustrates the use of the scientific method. One goal of an introductory statistics class is to learn how statisticians use the scientific method to answer questions. In the scientific method, one begins with a hypothesis or theory about some event, data is collected relevant to the problem, and then the theory is revised according to the data results. The Bayesian viewpoint provides a convenient paradigm for implementing the scientific method. The prior probability distribution can be used to state initial beliefs about the population of interest, relevant sample data is collected, and the posterior probability distribution reflects one’s new beliefs about the population in light of the data that were collected.

Topic14 Two-Way 確率テーブル に続く。

0 件のコメント:

コメントを投稿