SPSS で外れ値を削除する方法

統計分析の外れ値は、データセットの大部分に適合しないように見える極端な値です。これらの極端な値を削除しないと、問題のデータから引き出される可能性のある結論に大きな影響を与える可能性があります。これは、相関係数と最適な線が間違った方向に歪む可能性があるためです。 SPSS は、データ セットを解釈し、外れ値を特定して削除するために使用できる、数多くの統計分析ソフトウェア プログラムの 1 つです。
探索的データ分析
ステップ 1
「分析」をクリックします。 [記述統計] を選択し、続いて [探索] を選択します。
ステップ 2
従属変数データを含む列を「従属リスト」というラベルの付いたボックスにドラッグ アンド ドロップします。 [OK] をクリックします。
ステップ 3
個々のデータ ポイントを削除して、幹葉図または箱ひげ図で SPSS によって識別された外れ値を削除します。または、フィルタを設定してこれらのデータ ポイントを除外することもできます。
ステップ 4
[データ] を選択してから [ケースの選択] を選択し、除外したい外れ値がある条件をクリックします。外れ値のみを除外し、外れ値以外のデータ ポイントは除外しない、この条件の値を決定してください。
ステップ 5
[選択] ボックスで [条件が満たされている場合] を選択し、そのすぐ下にある [If] ボタンをクリックします。前の手順で決定した外れ値を除外するルールを右上のボックスに入力します。たとえば、条件「高さ」から 74.5 インチを超える測定値を除外する場合は、「高さ <=74.5」と入力します。 [続行] と [OK] をクリックしてフィルターを有効にします。
回帰分析
ステップ 1
「分析」メニューで、「回帰」を選択し、「線形」を選択します。分析する従属変数と独立変数を選択します。
ステップ 2
[保存] をクリックし、[クックの距離] を選択します。クック距離の計算値は、「COO-1」というラベルの付いた変数としてデータ ファイルに保存されます。
ステップ 3
「グラフ」に続いて「箱ひげ図」を選択して、箱ひげ図を実行します。 「シンプル」をクリックし、「個別変数の要約」を選択します。 [Boxes Represent] というラベルの付いたボックスに「COO-1」と入力し、[Label Cases By] ボックスにケースを識別するための ID または名前を入力します。
ステップ 4
ダブルクリックして、出力ファイルの箱ひげ図を拡大します。黒い線の外側にあるケースを書き留めます。これらは外れ値です。すべての外れ値を削除するか、星 (*) でマークされた極端な外れ値のみを削除するかを選択できます。
ステップ 5
データ ファイルに戻り、消去する必要があるケースを見つけます。下から順に、左端の灰色の列の数字を強調表示して、行全体が選択されるようにします。 「編集」をクリックし、「クリア」を選択します。箱ひげ図から特定した外れ値ごとに、この手順を繰り返します。
警告
セクション 2 の手順 5 でケースを消去する場合は、ケースを消去すると ID 番号が変わるため、常にデータ ファイルの末尾から上に向かって作業してください。トップダウンで作業すると、間違ったケースを消去してしまうことになります。