相関関係の意味

相関関係の意味

相関とは、2 つの物事、人、アイデアの間の類似性または関係を意味します。これは、2 つの異なる仮説、状況、またはオブジェクトの間に存在する類似性または同等性です。

統計と数学の分野では、相関とは、互いに関連する 2 つ以上の変数間の測定値を指します。

相関という用語は、ラテン語のcorrelationōne に由来する女性名詞です。

相関係数

統計学では、ピアソン相関係数(r) は積率相関係数とも呼ばれ、同じ計量スケール内の 2 つの変数間に存在する関係を測定します。

相関係数の機能は、データまたは既知の情報のセット間に存在する関係の強度を決定することです。

相関係数の値は -1 から 1 の間で変化し、得られた結果によって相関が負か正かを定義します。

係数を解釈するには、1 は変数間の相関が完全に正であることを意味し、-1 は完全に負であることを意味することを知っておく必要があります。係数が 0 に等しい場合は、変数が相互に依存していないことを意味します。

統計学には、統計学者チャールズ・スピアマンにちなんで名付けられたスピアマン相関係数もあります。この係数の機能は、線形であるかどうかにかかわらず、2 つの変数間の関係の強度を測定することです。

スピアマン相関は、分析された 2 つの変数間の関係の強度が単調関数 (初期の順序関係を保存または反転する数学関数) によって測定できるかどうかを評価するのに役立ちます。

相関関係の意味

ピアソン相関係数の計算

方法 1) 共分散と標準偏差を使用したピアソン相関係数の計算。

どこ

S XY は共分散です。

S xS y は、それぞれ変数 x と y の標準偏差を表します。

この場合、計算にはまず変数間の共分散と各変数の標準偏差を見つけることが含まれます。次に、共分散を標準偏差の乗算で割ります。

多くの場合、ステートメントでは、式を適用するだけで、変数の標準偏差または変数間の共分散がすでに提供されています。

方法 2) 生データを使用したピアソン相関係数の計算 (共分散または標準偏差なし)。

この方法を使用すると、最も簡単な式は次のようになります。

たとえば、血糖値 (y) と年齢 (x) という 2 つの変数の n=6 の観測値を含むデータがあると仮定すると、計算は次の手順に従います。

ステップ 1) 既存のデータ i、x、y を使用してテーブルを構築し、xy、x²、y² の空白列を追加します。

ステップ 2: x と y を掛けて「xy」列を埋めます。たとえば、1 行目では、x1y1 = 43 × 99 = 4257 となります。

ステップ 3: 列 x の値を二乗し、結果を列 x² に記録します。たとえば、最初の行には x 1 2 = 43 × 43 = 1849 となります。

ステップ 4: ステップ 3 と同じことを行い、y 列を使用して、値の 2 乗を y² 列に記録します。たとえば、最初の行には、y 1 2 = 99 × 99 = 9801 となります。

ステップ 5: すべての列番号の合計を取得し、結果を列フッターに配置します。たとえば、Age X 列の合計は 43+21+25+42+57+59 = 247 となります。

ステップ 6: 前述の式を使用して相関係数を取得します。

したがって、次のようになります。

相関関係の意味

スピアマン相関係数の計算

スピアマン相関係数の計算は少し異なります。これを行うには、データを次の表に整理する必要があります。

1. ステートメント内に 2 組のデータがあるため、それらをテーブルに導入する必要があります。例えば:

2. 「ランキング A」列では、「データ A」にある観測値を昇順に分類します。「1」が列の最低値、en (観測値の合計数) が最高値です。 「データA」列にある。この例では次のようになります。

3. 同じことを行って「ランキング B」列を取得します。今度は「データ B」列の観測値を使用します。

4. 「d」列には、2 つのランキング (A ~ B) の差を入力します。ここでは信号は関係ありません。

5. 「d」列の各値を二乗し、d² 列に記録します。

6. 「d²」列のデータをすべて合計します。この値がΣd²です。この例では、Σd² = 0+1+0+1 = 2

7. 次に、スピアマンの公式を使用します。

この場合、データ行の数 (観測値の数に相当) を見ると、n は 4 に等しくなります。

8. 最後に、データを前の式に代入します。

相関関係の意味

線形回帰

線形回帰は、他の変数 (x) の値がわかっている場合に、変数 (y) の取り得る値を推定するために使用される式です。 「x」の値は独立変数または説明変数であり、「y」の値は従属変数または応答変数です。

線形回帰は、変数「x」に応じて「y」の値がどのように変化するかを確認するために使用されます。ばらつきチェック値を含む直線を線形回帰直線と呼びます。

説明変数「x」が単一の値を持つ場合、回帰は単純線形回帰と呼ばれます。

参考動画一覧

関連記事