衛生統計考驗總結

第一節基本概念和基本步驟（非常重要）

一、統計工作的基本步驟

設計（最關鍵、決定成敗）、蒐集資料、整理資料、分析資料。

總體：根據研究目的決定的同質研究物件的全體，確切地說，是性質相同的所有觀察單位某一變數值的集合。總體的指標為引數。

實際工作中，經常是從總體中隨機抽取一定數量的個體，作為樣本，用樣本資訊來推斷總體特徵。樣本的指標為統計量。

由於總體中存在個體變異，抽樣研究中所抽取的樣本，只包含總體中一部分個體，這種由抽樣引起的差異稱為抽樣誤差。抽樣誤差愈小，用樣本推斷總體的精確度愈高；反之，其精確度愈低。

某事件發生的可能性大小稱為概率，用p表示，在0～1之間，0和1為肯定不發生和肯定發生，介於之間為偶然事件，<0.05或0.01為小概率事件。

二、變數的分類

變數：觀察單位的特徵，分數值變數和分類變數。

第二節數值變數資料的統計描述（重要考點）

一、描述計量資料的集中趨勢的指標有

1.均數均數是算術均數的簡稱，適用於正態或近似正態分佈。

2.幾何均數適用於等比資料，尤其是對數正態分佈的計量資料。對數正態分佈即原始資料呈偏態分布，經對數變換後（用原始資料的對數值lgx代替x）服從正態分佈，觀察值不能為0，同時有正和負。

3.中位數一組按大小順序排列的觀察值中位次居中的數值。可用於描述任何分布，特別是偏態分布資料的集中位置，以及分布不明或分布末端無確定資料資料的中心位置。

不能求均數和幾何均數，但可求中位數。百分位數是個界值，將全部觀察值分為兩部分，有x％比小，剩下的比大，可用於計算正常值範圍。

二、描述計量資料的離散趨勢的指標

1.全距和四分位數間距。

2.方差和標準差最為常用，適於正態分佈，既考慮了離均差（觀察值和總體均數之差），又考慮了觀察值個數，方差使原來的單位變成了平方，所以開方為標準差。均為數值越小，觀察值的變異度越小。

3.變異係數多組間單位不同或均數相差較大的情況。變異係數計算公式為：cv=s/×100％，公式中s為樣本標準差，為樣本均數。

三、標準差的應用

表示觀察值的變異程度（或離散程度）。

在兩組（或幾組）資料均數相近、度量單位相同的條件下，標準差大，表示觀察值的變異度大，即各觀察值離均數較遠，均數的代表性較差；反之，表示各觀察值多集中在均數周圍，均數的代表性較好。（常考！）

四、醫學參考值的計算方法，單雙側問題，醫學為95％

醫學參考值是指正常人體或動物體的各種生理常數，由於存在變異，各種資料不僅因人而異，而且同乙個人還會隨機體內外環境的改變而改變，因而需要確定其波動的範圍，即正常值範圍。

醫學參考值的計算公式：①正態分佈資料95％醫學參考值：±1.

96s（雙側）；+1.645s或-1.645s（單側），s為標準差。

②百分位數法p2.5和p97.5（雙側）；p5或p95（單側）。

第三節數值變數資料的統計推斷（重要考點）

一、標準誤，標準誤與標準差和樣本含量的關係

標準差和標準誤的區別。

樣本標準誤等於樣本標準差除以根號下樣本含量。標準誤與標準差成正比；與樣本含量的平方根成反比。因此。為減少抽樣誤差，應盡可能保證足夠大的樣本含量。

樣本標準差與樣本標準誤是既有聯絡又有區別的兩個統計量，二者的聯絡是公式：二者的區別在於：樣本標準差是反映樣本中各觀測值x1，x2，……，xn變異程度大小的乙個指標，它的大**明了對該樣本代表性的強弱。

樣本標準誤是樣本平均數1，2，……的標準差，它是抽樣誤差的估計值，其大**明了樣本間變異程度的大小及精確性的高低。（掌握！）

二、t分布和標準正態u分布關係

均以0為中心左右兩側完全對稱的分布，只是t分布曲線頂端較u分布低，兩端翹。（v逐漸增大，t分布逐漸逼近u分布）。

正態分佈的特點：①以均數為中心左右兩側完全對稱分布；②兩個引數，均數u（位置引數）和s（變異引數）；③對稱均數的兩側面積相等。

三、總體均數的估計

樣本統計量推算總體均數有兩個重要方面：區間估計和假設檢驗。樣本均數估計總體均數稱點估計。

總體均數區間估計（可信區間）的概念：按一定的可信度估計未知總體均數所在範圍。其統計上習慣用95％（或99％）可信區間表示總體均數μ有95％（或99％）的可能在某一範圍。

可信區間的兩個要素，一為準確度，反映在可信度1-α的大小，即區間包含總體均數的概率大小，當然愈接近1愈好；二是精度，反映在區間的長度，當然長度愈小愈好。在樣本例數確定的情況下，二者是矛盾的，需要兼顧。

總體均數可信區間的計算方法：

1.當n小按t分布的原理用式計算可信區間為：±tα/2，vs

2.當n足夠大因n足夠大時，t分布逼近μ分布，按正態分佈原理。用式估計可信區間為：±μα/2s

可信區間與醫學參考值範圍的區別：二者的意義和演算法不同。

四、假設檢驗的步驟

1.建立假設：h0（無效，兩樣本代表的總體均數相同），h1（備擇，兩樣本來自不同總體），當拒絕h0就接受h1，不拒絕就不接受h1。

2.確定顯著性水平：區分大概率和小概率事件的標準，通常取α=0.05。

3.計算統計量：根據資料型別和分析目的選擇適當的公式計算。

4.確定概率p值：將計算得到的t值或u值查界值表得到p值和α值比較。

5.做出推斷結論。

｜t｜值、p值與統計結論

五、兩均數的假設檢驗（常考！）

1.樣本均數與總體均數比較 u檢驗和t檢驗用於樣本均數與總體均數的比較。理論上要求樣本來自正態分佈總體實際中，只要樣本例數n較大，或n小但總體標準差σ已知，就選用u檢驗。

n較小且σ未知時，用於t檢驗。兩樣本均數比較時還要求兩總體方差等。

以算得的統計量t，按表所示關係作判斷。

2.配對資料的比較在醫學研究中，常用配對設計。配對設計主要有四種情況：

①同一受試物件處理前後的資料；②同一受試物件兩個部位的資料；③同一樣品用兩種方法（儀器等）檢驗的結果；④配對的兩個受試物件分別接受兩種處理後的資料。情況①的目的是推斷其處理有無作用；情況②、③、④的目的是推斷兩種處理（方法等）的結果有無差別。

v=對子數-1；如處理前後或兩法無差別，則其差數d的總體均數應為0，可看作樣本均數和總體均數0的比較。為差數的均數；為差數均數的標準誤，sd為差數的標準差；n為對子數。因計算的統計量是t，按表所示關係作判斷。

3.完全隨機設計的兩樣本均數的比較亦稱成組比較。目的是推斷兩樣本各自代表的總體均數μ1與μ2是否相等。根據樣本含量n的大小，分u檢驗與t檢驗。

t檢驗用於兩樣本含量n1、n2較小時，且要求兩總體方差相等，即方差齊。若被檢驗的兩樣本方差相差顯著則需用t′檢驗。

u檢驗：兩樣本量足夠大，n>50。

=v=(n1-1)+(n2-1)=n1+n2-2

式中，為兩樣本均數之差的標準誤，sc2為合併估計方差（combined estimate variance）。算得的統計量為t，按表所示關係做出判斷。

4.ⅰ型錯誤和ⅱ型錯誤棄真，拒絕正確的h0為ⅰ型錯誤α表示，若顯著性水平α定為0.05，則犯ⅰ型錯誤的概率0.

05；接受錯誤的h0為ⅱ型錯誤，概率用β表示，β值的大小很難確切估計。當樣本含量一定時，兩者反比，增大n，當α一定時，可減少β。1-β稱為檢驗效能或把握度，其統計意義是若兩總體確有差別，按α水準能檢出其差別的能力。

客觀實際拒絕h0不拒絕h0

h0成立型錯誤推斷正確1-α

h0不成立推斷正確（1型錯誤（β）

5.假設檢驗注意事項保證組間可比性；根據研究目的、資料型別和設計型別選用適當的檢驗方法，熟悉各種檢驗方法的應用條件；「顯著與否」是統計學術語，為「有無統計學意義」，不能理解為「差別是不是大」；結論不能絕對化。

第四節分類變數資料的統計描述（一般考點）

相對數是兩個有關聯事物資料之比。常用的相對數指標有構成比、率、相對比等。

一、構成比

表示事物內部各個組成部分所佔的比重，通常以100為例基數，故又稱為百分比。其公式如下：

構成比＝×100％

該式可用符號表達如下：

構成比＝×100％

構成比有兩個特點：

（1）各構成部分的相對數之和為100％.

（2）某一部分所佔比重增大，其他部分會相應地減少。

二、率用以說明某種現象發生的頻率或強度，故又稱頻率指標，以100，1000，10000或100000為比例基數（k）均可，原則上以結果至少保留一位整數為宜，其計算公式為：

率和構成比不同之處：率的大小僅取決於某種現象的發生數和可能發生該現象的總數，不受其他指標的影響，並且各率之和一般不為1。

率＝×k

該式亦可用符號表達如下

陽性率＝×k（若算陰性率則分子為a（-））

式中a（+）為陽性人數，a（-）為陰性人數。

三、相對比

表示有關事物指標之對比，常以百分數和倍數表示，其公式為：

相對比：甲指標/乙指標（或×100％）

或用符號表示為：a/b×k

四、注意事項

①構成比和率的不同，不能以比代率；②計算相對數時，觀察例數不宜過小；③率的比較注意可比性，特別是混雜因素的問題，有的話，可用標準化法和分層分析消除；④觀察單位不同的幾個率的平均率不等於幾個率的算術均數；⑤樣本率或構成比的比較應做假設檢驗。

第五節分類變數資料的統計推斷（非常重要）

一、率的抽樣誤差

用抽樣方法進行研究時，必然存在抽樣誤差。率的抽樣誤差大小可用率的標準誤來表示，計算公式如下：

σp=式中：σp為率的標準誤，π為總體陽性率，n為樣本含量。因為實際工作中很難知道總體陽性率π，故一般採用樣本率p來代替，而上式就變為

sp=二、總體率的可信區間

由於樣本率與總體率之間存在著抽樣誤差，所以也需根據樣本率來推算總體率所在的範圍，根據樣本含量n和樣本率p的大小不同，分別採用下列兩種方法：

（一）正態近似法（常考！）

當樣本含量n足夠大，且樣本率p和（1-p）均不太小，如np或n（1-p）均≥5時，樣本率的分布近似正態分佈。則總體率的可信區間可由下列公式估計：

總體率（π）的95％可信區間：p±1.96sp

總體率（π）的99％可信區間：p±2.58sp

（二）查表法當樣本含量n較小，如n≤50，特別是p接近0或1時，則按二項分布原理確定總體率的可信區間，其計算較繁，讀者可根據樣本含量n和陽性數x參照專用統計學介紹的二項分布中95％可信限表。

三、u檢驗（非常重要！）

當樣本含量n足夠大，且樣本率p和（1-p）均不太小，如np或n（1-p）均≥5時，樣本率的分布近似正態分佈。樣本率和總體率之間、兩個樣本率之間差異的判斷可用u檢驗。

衛生統計考驗總結

社群衛生統計總結

衛生統計學》試卷

《衛生統計學》課程複習

衛生統計考驗總結

社群衛生統計總結

衛生統計學》試卷

《衛生統計學》課程複習

相關推薦