信頼区間

信頼区間

これは統計で使用される間隔の推定値であり、母集団パラメータが含まれます。この未知の母集団パラメータは 、収集されたデータから計算されたサンプリング モデル を通じて検出されます。

例: 収集されたサンプルの平均 x̅ は、母集団の真の平均値 μ と一致する場合もあれば、一致しない場合もあります。これを行うには、この母集団平均が含まれるサンプル平均の範囲を考慮することが可能です。この間隔が長いほど、この問題が発生する可能性が高くなります。

信頼区間は信頼水準と呼ばれるパーセンテージで表され、90%、95%、99% が最適です。たとえば、以下の画像では、上限と下限の間に 90% の信頼区間 ( ae -a ) があります。

信頼区間は、不確実性の尺度として使用されるため、統計における仮説検定で最も重要な概念の 1 つです。この用語は、1937 年にポーランドの数学者で統計学者の イエジー・ネイマン によって導入されました。

信頼区間はどのくらい重要ですか?

信頼区間は、実行された計算に関する不確実性 (または不正確さ) のマージンを示すために重要です。この計算では、研究サンプルを使用して、ソース母集団における結果の実際のサイズを推定します。

信頼区間の計算は、誤差サンプリングを考慮した戦略です。研究結果のサイズとその信頼区間は、元の母集団の推定値を特徴づけます。

信頼区間が狭いほど、研究母集団のパーセンテージがソース母集団の実数を表す確率が高くなり、研究対象の結果に関する確実性が高まります。

信頼区間

信頼区間をどう解釈するか?

信頼区間を正しく解釈することは、おそらくこの統計概念の最も困難な側面です。この概念の最も一般的な解釈の例は次のとおりです。

将来、母集団パラメータの真の値 (平均など) が X (下限) と Y (上限) の範囲に収まる 確率は 95% です。

したがって、信頼区間は次のように解釈されます 。X (下限) と Y (上限) の間の区間に母集団パラメーターの真の値が含まれることは 95% の信頼度です。

「X (下限) と Y (上限) の間の間隔に母集団パラメータの実際の値が含まれる確率は 95% である」という表現は 完全に誤り です。

上記の記述は、信頼区間に関する最も一般的な誤解です。統計範囲が計算された後、それには母集団パラメーターのみが含まれる場合もあれば、含まれない場合もあります。

ただし、範囲はサンプル間で異なる場合がありますが、真の母集団パラメータはサンプルに関係なく同じです。

したがって、信頼区間に関する確率の記述は、サンプル数に対して信頼区間が再計算される場合にのみ行うことができます。

信頼区間

信頼区間を計算する手順

範囲は次の手順で計算されます。

1. サンプル データを収集します: n ;

2. サンプル平均 x̅ を計算します。

3. 母集団の標準偏差 ( σ ) が既知であるか未知であるかを判断します。

4. 母集団の標準偏差がわかっている場合、 Z 点を対応する信頼水準に使用できます。

5. 母集団の標準偏差が不明な場合は、対応する信頼水準に t 統計を使用できます。

したがって、信頼区間の下限と上限は、次の式を使用して求められます。

a) 既知の母集団の標準偏差:

b) 未知の母集団の標準偏差 :

信頼区間

信頼区間の実際の例

臨床研究では、成人における喘息の存在と閉塞性睡眠時無呼吸症候群の発症リスクとの関連性が評価されました。

一部の成人は州公務員のリストから無作為に採用され、4年間にわたって追跡調査された。

喘息のある参加者は、喘息のない参加者と比較して、4年以内に無呼吸を発症するリスクが高かった。

この例のような臨床研究を実施する場合、通常、研究の効率を高める(コストと時間を削減する)ために、対象となる母集団のサブグループが募集されます。

この個人のサブグループである研究対象集団は、以下の図に示すように、包含基準を満たし、研究への参加に同意する人々で構成されます。

その後、研究が完了し、研究の疑問に答えるために効果量 (例: 平均差 相対リスク ) が計算されます。

推論 と呼ばれるこのプロセスには、研究対象母集団から収集されたデータを使用して、対象母集団、つまりソース母集団における実際の効果量を推定することが含まれます。

示された例では、研究者らは、資格があり、研究に参加することに同意した州職員の無作為サンプル(ソース集団)を募集し(研究集団)、喘息は研究集団において無呼吸を発症するリスクを高めると報告しました。

関心のある母集団のサブグループのみを採用したことによるサンプリング誤差を考慮するために、 95% 信頼区間 (推定値の近傍) 1.06 ~ 1.82 も計算しました。これは 、ソース母集団における真の相対リスクが 95 % である確率を示しています。 は 1.06 から 1.82 の間になります

信頼区間

平均値の信頼区間

母集団の標準偏差に関する情報があれば、その母集団の平均値または平均値の信頼区間を計算できます。

測定される統計的特性 (収入、IQ、価格、身長、数量、体重など) が数値である場合、ほとんどの場合、母集団の平均値を見つけるために推定されます。

したがって、標本平均 ( ) を使用して、誤差を許容して母集団平均 ( μ ) を求めようとします。この計算の結果は、 母平均の信頼区間 と呼ばれます。

母集団の標準偏差がわかっている場合、母集団平均の信頼区間 (CI) の式は次のようになります。

どこ:

  • はサンプル平均です。
  • σ は母集団の標準偏差です。
  • n はサンプルサイズです。
  • Ζ* は、 希望する信頼水準に対する標準正規分布の適切な値を表します。

以下は、さまざまな信頼水準 ( Ζ* ) の値です。

信頼レベル Z値*-
80% 1.28
90% 1,645(従来)
95% 1.96
98% 2.33
99% 2.58

上の表は、特定の信頼水準に対する z* 値を示しています。これらの値は標準正規分布 (Z-) から取得されていることに注意してください。

各 z* 値とその値の負の値の間の領域が、(おおよその) 信頼パーセンテージです。たとえば、z * = 1.28 と z = -1.28 の間の領域は約 0.80 です。したがって、この表は他の信頼率にも拡張できます。この表には、最も一般的に使用される信頼パーセンテージのみが示されています。

「仮説」 も参照してください。

参考動画一覧

関連記事