« 原発事故汚染水の傾向と対策/原発事故の真相(129) | トップページ | 川崎中1殺人事件は偶発的か?/日本の針路(114) »

2015年3月 2日 (月)

類似性と「醜いアヒルの子の定理」/知的生産の方法(115)

「分ける」と「分かる」は、語源からして関係があると察しがつく。
分ける、分類するという行為は、簡単なようで複雑な問題を秘めている。
たとえば次のような問題を考えてみよう。

ここに100円硬貨が2枚ある。
2枚の100円硬貨は同じだろうか?

100円硬貨はどれでも同じように使える。
つまり、われわれはどの100円硬貨も同じものと思っている。
しかし、注意深くみれば、2枚の硬貨には違いが見つかるだろう。
製造年も違うだろうし、傷の位置も違うし、精密に測定すれば重さも違う。

それでは別に1枚の10円硬貨があったとして、10円硬貨と100円硬貨は同じだろうか?
10円硬貨は100円硬貨の価値がない。
したがって、10円硬貨は100円硬貨と異なる。
しかし、硬貨であることにおいては同じである。
2枚の100円硬貨同士の方が、100円硬貨と10円硬貨よりも類似性が高いと考えるのが常識というものだろう。

類似性の問題に関しては、「醜いアヒルの子の定理 (ugly duckling theorem) 」と呼ばれる有名な定理がある。
次のように説明されている。

醜いアヒルの子を含む n 匹のアヒルがいるとする. このとき,醜いアヒルの子と普通のアヒルの子の類似性は,任意の二匹の普通のアヒルの子の間の類似性と同じになるという定理.
n匹のアヒルの子を区別するために,K=log(n)個の二値の特徴量を使う. これらの特徴量を使ってできるルールは,各アヒルについて含む・含まないが独立にありうるが,どのアヒルも含まないルールは除外するので,全部で N=2 n −1個存在.
これら N個のルールのうち,醜いアヒルの子とある普通のアヒルの子のどちらも含むようなルールは 2 n−2個. 一方,任意の二匹の普通のアヒルの子を同時に含むルールはやはり 2 n−2個. 二匹のアヒルの類似性を,これらを共通に真にするルールの数で評価すると,醜いアヒルの子と普通のアヒルの子は,アヒルの子どうしと同じくらい類似していることになる.
これは,各特徴量を全て同等に扱っていることにより成立する定理. すなわち,クラスというものを特徴量で記述するときには,何らかの形で特徴量に重要性を考えていることになる. この定理は,特徴選択や特徴抽出が識別やパターン認識にとって本質的であることを示唆している.
朱鷺の杜Wiki

また、野口悠紀雄氏は以下のように説明している。

人間の認知パタンから独立した客観的な性質をことごとく選んでそれらを等価とみなすと、すべての対象は同じぐらい似ていることが証明できる。あひると白鳥は、2羽の白鳥が似ているのと同じくらい似ているという意味で、これを「みにくいあひるの子定理」という。渡辺慧氏により厳密に証明された。したがって、すべての分類は、本来的に恣意的なものである。あるいは、分類とは、世界観の表明にほかならない。
野口悠紀雄『「超」整理法―情報検索と発想の新システム』中公新書(1993年10月)

どういうことか?
醜いアヒルの子と普通のアヒルの子は、普通のアヒルの子同士と同じくらい類似している、つまり醜いアヒルの子も普通のアヒルの子も、類似性には違いはない。
性質の共通点の個数を比較する限り、すべて同じ類似性だということである。
硬貨の例で言えば、10円硬貨と100円硬貨の違いと、100円硬貨同士の違いに、違いはないということである。

これは明らかにわれわれの感覚的理解とは異なる。
醜いアヒルの子と普通のアヒルの子がいるとすれば、普通のアヒルの子同士の方が類似性が高いように認識する。
100円硬貨同士の方が類似性が高いと認識する。

しかし、これは予め「醜いか醜くないか」ということに関しては、他の区別の基準よりも大きなウェイトを置いている結果である。
硬貨の価値の違いに優先度を置いた結果である。

何に優先度を置くかということは、野口悠紀雄氏のいうように「世界観の表明にほかならない」。
これが差別というもの本質であろう。

|

« 原発事故汚染水の傾向と対策/原発事故の真相(129) | トップページ | 川崎中1殺人事件は偶発的か?/日本の針路(114) »

日記・コラム・つぶやき」カテゴリの記事

書籍・雑誌」カテゴリの記事

知的生産の方法」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/395349/55304055

この記事へのトラックバック一覧です: 類似性と「醜いアヒルの子の定理」/知的生産の方法(115):

« 原発事故汚染水の傾向と対策/原発事故の真相(129) | トップページ | 川崎中1殺人事件は偶発的か?/日本の針路(114) »