無料ブログはココログ

« エンピリカルソフトウェア工学の研究事例 | トップページ | スパゲティプロセスからの脱却を目指そう »

クヌース先生の本の選び方

SEA関西の勉強会でコンピュータサイエンスで有名なクヌース先生の本の選び方を話したら、予想外に評判が良かったのでまとめてみます。

ことのきっかけは、XP祭りでバグなし本の児玉さんが紹介された「コンピュータ科学者がめったに語らないこと」という本です。

この本は、クヌース先生が長期休暇中に行った「3:16プロジェクト」について語られたMITで講演内容が書かれています。「3:16プロジェクト」は、聖書の概要を知るために聖書を構成する各文書の3章16節(3:16と表記される)について、その翻訳や解説をとことん調べるというものです。

まだ、あまり読み進んでいませんので詳しくはかけませんが、コンピュータ科学者が聖書の知識を、人工知能やロボットなどのアイデアとして利用されることがあるようです。そういえば、ユビキタスという言葉も「いたるところに偏在する(神)」という神学用語で、日本ではそれに対抗して「八百万(やおよろず)プロジェクト」という名前の研究プロジェクトもありました。

クヌース先生はルーテル派(プロテスタント運動を最初に起こしたルターの流れを汲む教派、倫理社会で習いました:-)のクリスチャンではありますが、聖書についてのプロではなく、また、聖書は多くの文書で構成されるので、それをすべて知ることができません。そこで、各文書の3章16節を調べて聖書の各文書の傾向や聖書の概要を調べようとされたのです。

この方法は、ランダムサンプリングと呼ばれる方法です。全体を網羅できないときに乱数を用いて部分的に調べて全体像を知る方法です。乱数を聖書に単純に適用すると、ページ数の多い文書によって全体の傾向が決まってしまいます。

そこで、各文書のうち1節だけを抜き出すという方法をとられました。これは層化抽出方式というもので、アンケートなどでも年齢層ごとや地域ごとに一定人数を集めるなどされていますが、それと同じ統計的手法です。

通常なら各文書に乱数を当てはめるのですが、前過ぎる節や後ろ過ぎる節に当たるとその文書の内容を示さなくなってしまいます。そこで、あまり前過ぎず、後ろ過ぎず、多くの文書にあるという理由から3章16節が選ばれました(実は、ヨハネによる福音書の3章16節が非常に有名な言葉なので、そこだけは得ることがあるだろうと選ばれました)。

この方式、実はクヌース先生が実生活で書籍選びに用いられている方法らしいです。書店に行って、面白そうな本があると、その本の100ページを読まれるそうです。あまり前過ぎず、後ろ過ぎない100ページというのは、その本の大まかな傾向を示しているそうです。

たまたまそのページが、見出しだけの意味のないページだったり、100ページない本の場合もありますが、その場合は直前や一定量ずらすということが行われました。3:16プロジェクトでも同じことをされました。

これまで、「目次」や「はじめに」を見て決めることがあったのですが、一度この方法を試してみようと思います。

このエントリーをはてなブックマークに追加


« エンピリカルソフトウェア工学の研究事例 | トップページ | スパゲティプロセスからの脱却を目指そう »

書籍・雑誌」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/138594/44576622

この記事へのトラックバック一覧です: クヌース先生の本の選び方:

« エンピリカルソフトウェア工学の研究事例 | トップページ | スパゲティプロセスからの脱却を目指そう »