« 新興重化学工業発展の時代背景 | トップページ | 「同じ」と「違い」の分かる男 »

2009年8月 7日 (金)

異常と正常の区分

異常の反対語は正常だろう。
異常と正常はどう区分されるだろうか?
たとえば、精神状態に関し、正常か異常かと問われることがある。
この場合は、正常とは圧倒的な多数派であり、異常は極端な少数派ということだろう。
そこには、分布的な意味はあるが、価値的な基準があるとは思えない。
にもかかわらず、一般的には、正常は好ましく、異常は好ましくない、とされている。

また、健康診断の測定値などに関しても、正常と異常の区分が行われている。
血圧、血糖値などについて、正常とされる範囲が決まっていて、それを外れると、異常とされて、再検査を求められる。
血圧の場合、正常範囲は、収縮期血圧で130mmHg未満、拡張期血圧で85mmHg未満とされている。
私は、血圧の薬を常用しているが、それでも130mmHg以下になることは殆どない。
つまり、血圧に関しては、正常者ではない、ということになる。

最近は、特にメタボリック・シンドロームとの関係で、測定値が重要な意味を持つようになってきた。
血圧なども、昔は<年齢+90>程度であれば可とされていたように思う。
正常値の範囲が狭くなってきたことは、それだけ早期治療を可能にする、ということだろうが、つい製薬業界等が何らかの影響力を行使しているのではないか、などと勘繰ってしまう。

ところで、異常か正常かの判断は、対象が多数あることが前提である。
たとえば、世の中に1つしかないものについては、異常も正常もないだろう。
統計的な取り扱いでは、異常値はどう判断されているであろうか?
多数のデータの中で、1つだけ他のデータとかけ離れている値を、外れ値という。

このデータを異常値として棄却するべきかどうか?
データをサンプリングしたときに、測定ミスをしたかもしれないし、数値をうつし間違っていたかもしれない。
1つだけかけ離れた値といえども「異常」であるかどうかは一概には決められない。
かけ離れた値が発生した原因は何か?

外れ値は、データの標準偏差(SD/σ)の2倍、ないし3倍を超える値を指すことが多い。
従来、品質管理においては、3σを超える外れ値について管理することが多かった。
3σを超える外れ値の出現確率は、3/1000程度である。
これに対して、品質のばらつきが、正規分布の中心から上下限の範囲を6σの範囲に納めるように管理する6σの品質管理がある。
6σは、100万個に3~4個ということであり、従来の品質管理水準に比べると、1000倍の精度ということになる。

外れ値を異常値として棄却するかどうかを検定する方法として、グラブス・スミルノフ棄却検定というものがある。
以下のような手順の検定である。
http://www.tamagaki.com/math/Statistics608.html

1.仮説
帰無仮説:”他のデータとかけ離れた値は異常値ではない。”
対立仮説:”他のデータとかけ離れた値は異常値である。”
2.有意水準αを決め、スミルノフ棄却検定表よりデータ数 n のときの値 k を得る。
3.検定統計量Tを求める。
3T>k で帰無仮説を棄却し、対立仮説を採用する。
つまり、有意水準αで、かけ離れた値は異常値とみなして棄却される。

異常値を含んだデータについて回帰分析等を行うと誤った判断に陥る危険性があるが、外れ値は往々にして何らかの異変を発見する手がかりになるものである。
特に医療データの場合は、異変の早期発見・早期治療に結び付く可能性が大きい。

|

« 新興重化学工業発展の時代背景 | トップページ | 「同じ」と「違い」の分かる男 »

ニュース」カテゴリの記事

思考技術」カテゴリの記事

水問題」カテゴリの記事

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: 異常と正常の区分:

« 新興重化学工業発展の時代背景 | トップページ | 「同じ」と「違い」の分かる男 »