衛生統計考驗總結

2022-06-25 02:00:03 字數 5037 閱讀 7953

第一節基本概念和基本步驟(非常重要)

一、統計工作的基本步驟

設計(最關鍵、決定成敗)、蒐集資料、整理資料、分析資料。

總體:根據研究目的決定的同質研究物件的全體,確切地說,是性質相同的所有觀察單位某一變數值的集合。總體的指標為引數。

實際工作中,經常是從總體中隨機抽取一定數量的個體,作為樣本,用樣本資訊來推斷總體特徵。樣本的指標為統計量。

由於總體中存在個體變異,抽樣研究中所抽取的樣本,只包含總體中一部分個體,這種由抽樣引起的差異稱為抽樣誤差。抽樣誤差愈小,用樣本推斷總體的精確度愈高;反之,其精確度愈低。

某事件發生的可能性大小稱為概率,用p表示,在0~1之間,0和1為肯定不發生和肯定發生,介於之間為偶然事件,<0.05或0.01為小概率事件。

二、變數的分類

變數:觀察單位的特徵,分數值變數和分類變數。

第二節數值變數資料的統計描述(重要考點)

一、描述計量資料的集中趨勢的指標有

1.均數均數是算術均數的簡稱,適用於正態或近似正態分佈。

2.幾何均數適用於等比資料,尤其是對數正態分佈的計量資料。對數正態分佈即原始資料呈偏態分布,經對數變換後(用原始資料的對數值lgx代替x)服從正態分佈,觀察值不能為0,同時有正和負。

3.中位數一組按大小順序排列的觀察值中位次居中的數值。可用於描述任何分布,特別是偏態分布資料的集中位置,以及分布不明或分布末端無確定資料資料的中心位置。

不能求均數和幾何均數,但可求中位數。百分位數是個界值,將全部觀察值分為兩部分,有x%比小,剩下的比大,可用於計算正常值範圍。

二、描述計量資料的離散趨勢的指標

1.全距和四分位數間距。

2.方差和標準差最為常用,適於正態分佈,既考慮了離均差(觀察值和總體均數之差),又考慮了觀察值個數,方差使原來的單位變成了平方,所以開方為標準差。均為數值越小,觀察值的變異度越小。

3.變異係數多組間單位不同或均數相差較大的情況。變異係數計算公式為:cv=s/×100%,公式中s為樣本標準差,為樣本均數。

三、標準差的應用

表示觀察值的變異程度(或離散程度)。

在兩組(或幾組)資料均數相近、度量單位相同的條件下,標準差大,表示觀察值的變異度大,即各觀察值離均數較遠,均數的代表性較差;反之,表示各觀察值多集中在均數周圍,均數的代表性較好。(常考!)

四、醫學參考值的計算方法,單雙側問題,醫學為95%

醫學參考值是指正常人體或動物體的各種生理常數,由於存在變異,各種資料不僅因人而異,而且同乙個人還會隨機體內外環境的改變而改變,因而需要確定其波動的範圍,即正常值範圍。

醫學參考值的計算公式:①正態分佈資料95%醫學參考值:±1.

96s(雙側);+1.645s或-1.645s(單側),s為標準差。

②百分位數法p2.5和p97.5(雙側);p5或p95(單側)。

第三節數值變數資料的統計推斷(重要考點)

一、標準誤,標準誤與標準差和樣本含量的關係

標準差和標準誤的區別。

樣本標準誤等於樣本標準差除以根號下樣本含量。標準誤與標準差成正比;與樣本含量的平方根成反比。因此。為減少抽樣誤差,應盡可能保證足夠大的樣本含量。

樣本標準差與樣本標準誤是既有聯絡又有區別的兩個統計量,二者的聯絡是公式:二者的區別在於:樣本標準差是反映樣本中各觀測值x1,x2,……,xn變異程度大小的乙個指標,它的大**明了對該樣本代表性的強弱。

樣本標準誤是樣本平均數1,2,……的標準差,它是抽樣誤差的估計值,其大**明了樣本間變異程度的大小及精確性的高低。(掌握!)

二、t分布和標準正態u分布關係

均以0為中心左右兩側完全對稱的分布,只是t分布曲線頂端較u分布低,兩端翹。(v逐漸增大,t分布逐漸逼近u分布)。

正態分佈的特點:①以均數為中心左右兩側完全對稱分布;②兩個引數,均數u(位置引數)和s(變異引數);③對稱均數的兩側面積相等。

三、總體均數的估計

樣本統計量推算總體均數有兩個重要方面:區間估計和假設檢驗。樣本均數估計總體均數稱點估計。

總體均數區間估計(可信區間)的概念:按一定的可信度估計未知總體均數所在範圍。其統計上習慣用95%(或99%)可信區間表示總體均數μ有95%(或99%)的可能在某一範圍。

可信區間的兩個要素,一為準確度,反映在可信度1-α的大小,即區間包含總體均數的概率大小,當然愈接近1愈好;二是精度,反映在區間的長度,當然長度愈小愈好。在樣本例數確定的情況下,二者是矛盾的,需要兼顧。

總體均數可信區間的計算方法:

1.當n小按t分布的原理用式計算可信區間為:±tα/2,vs

2.當n足夠大因n足夠大時,t分布逼近μ分布,按正態分佈原理。用式估計可信區間為:±μα/2s

可信區間與醫學參考值範圍的區別:二者的意義和演算法不同。

四、假設檢驗的步驟

1.建立假設:h0(無效,兩樣本代表的總體均數相同),h1(備擇,兩樣本來自不同總體),當拒絕h0就接受h1,不拒絕就不接受h1。

2.確定顯著性水平:區分大概率和小概率事件的標準,通常取α=0.05。

3.計算統計量:根據資料型別和分析目的選擇適當的公式計算。

4.確定概率p值:將計算得到的t值或u值查界值表得到p值和α值比較。

5.做出推斷結論。

|t|值、p值與統計結論

五、兩均數的假設檢驗(常考!)

1.樣本均數與總體均數比較 u檢驗和t檢驗用於樣本均數與總體均數的比較。理論上要求樣本來自正態分佈總體實際中,只要樣本例數n較大,或n小但總體標準差σ已知,就選用u檢驗。

n較小且σ未知時,用於t檢驗。兩樣本均數比較時還要求兩總體方差等。

以算得的統計量t,按表所示關係作判斷。

2.配對資料的比較在醫學研究中,常用配對設計。配對設計主要有四種情況:

①同一受試物件處理前後的資料;②同一受試物件兩個部位的資料;③同一樣品用兩種方法(儀器等)檢驗的結果;④配對的兩個受試物件分別接受兩種處理後的資料。情況①的目的是推斷其處理有無作用;情況②、③、④的目的是推斷兩種處理(方法等)的結果有無差別。

v=對子數-1;如處理前後或兩法無差別,則其差數d的總體均數應為0,可看作樣本均數和總體均數0的比較。為差數的均數;為差數均數的標準誤,sd為差數的標準差;n為對子數。因計算的統計量是t,按表所示關係作判斷。

3.完全隨機設計的兩樣本均數的比較亦稱成組比較。目的是推斷兩樣本各自代表的總體均數μ1與μ2是否相等。根據樣本含量n的大小,分u檢驗與t檢驗。

t檢驗用於兩樣本含量n1、n2較小時,且要求兩總體方差相等,即方差齊。若被檢驗的兩樣本方差相差顯著則需用t′檢驗。

u檢驗:兩樣本量足夠大,n>50。

=v=(n1-1)+(n2-1)=n1+n2-2

式中,為兩樣本均數之差的標準誤,sc2為合併估計方差(combined estimate variance)。算得的統計量為t,按表所示關係做出判斷。

4.ⅰ型錯誤和ⅱ型錯誤棄真,拒絕正確的h0為ⅰ型錯誤α表示,若顯著性水平α定為0.05,則犯ⅰ型錯誤的概率0.

05;接受錯誤的h0為ⅱ型錯誤,概率用β表示,β值的大小很難確切估計。當樣本含量一定時,兩者反比,增大n,當α一定時,可減少β。1-β稱為檢驗效能或把握度,其統計意義是若兩總體確有差別,按α水準能檢出其差別的能力。

客觀實際拒絕h0不拒絕h0

h0成立型錯誤推斷正確1-α

h0不成立推斷正確(1型錯誤(β)

5.假設檢驗注意事項保證組間可比性;根據研究目的、資料型別和設計型別選用適當的檢驗方法,熟悉各種檢驗方法的應用條件;「顯著與否」是統計學術語,為「有無統計學意義」,不能理解為「差別是不是大」;結論不能絕對化。

第四節分類變數資料的統計描述(一般考點)

相對數是兩個有關聯事物資料之比。常用的相對數指標有構成比、率、相對比等。

一、構成比

表示事物內部各個組成部分所佔的比重,通常以100為例基數,故又稱為百分比。其公式如下:

構成比=×100%

該式可用符號表達如下:

構成比=×100%

構成比有兩個特點:

(1)各構成部分的相對數之和為100%.

(2)某一部分所佔比重增大,其他部分會相應地減少。

二、率用以說明某種現象發生的頻率或強度,故又稱頻率指標,以100,1000,10000或100000為比例基數(k)均可,原則上以結果至少保留一位整數為宜,其計算公式為:

率和構成比不同之處:率的大小僅取決於某種現象的發生數和可能發生該現象的總數,不受其他指標的影響,並且各率之和一般不為1。

率=×k

該式亦可用符號表達如下

陽性率=×k(若算陰性率則分子為a(-))

式中a(+)為陽性人數,a(-)為陰性人數。

三、相對比

表示有關事物指標之對比,常以百分數和倍數表示,其公式為:

相對比:甲指標/乙指標(或×100%)

或用符號表示為:a/b×k

四、注意事項

①構成比和率的不同,不能以比代率;②計算相對數時,觀察例數不宜過小;③率的比較注意可比性,特別是混雜因素的問題,有的話,可用標準化法和分層分析消除;④觀察單位不同的幾個率的平均率不等於幾個率的算術均數;⑤樣本率或構成比的比較應做假設檢驗。

第五節分類變數資料的統計推斷(非常重要)

一、率的抽樣誤差

用抽樣方法進行研究時,必然存在抽樣誤差。率的抽樣誤差大小可用率的標準誤來表示,計算公式如下:

σp=式中:σp為率的標準誤,π為總體陽性率,n為樣本含量。因為實際工作中很難知道總體陽性率π,故一般採用樣本率p來代替,而上式就變為

sp=二、總體率的可信區間

由於樣本率與總體率之間存在著抽樣誤差,所以也需根據樣本率來推算總體率所在的範圍,根據樣本含量n和樣本率p的大小不同,分別採用下列兩種方法:

(一)正態近似法(常考!)

當樣本含量n足夠大,且樣本率p和(1-p)均不太小,如np或n(1-p)均≥5時,樣本率的分布近似正態分佈。則總體率的可信區間可由下列公式估計:

總體率(π)的95%可信區間:p±1.96sp

總體率(π)的99%可信區間:p±2.58sp

(二)查表法當樣本含量n較小,如n≤50,特別是p接近0或1時,則按二項分布原理確定總體率的可信區間,其計算較繁,讀者可根據樣本含量n和陽性數x參照專用統計學介紹的二項分布中95%可信限表。

三、u檢驗(非常重要!)

當樣本含量n足夠大,且樣本率p和(1-p)均不太小,如np或n(1-p)均≥5時,樣本率的分布近似正態分佈。樣本率和總體率之間、兩個樣本率之間差異的判斷可用u檢驗。

社群衛生統計總結

擔任統計員,為了能完成好上級交給的每一項工作任務,在工作中將社群所有的底商和單位都走訪一遍,並做好基礎資訊登記,在經濟普查中,認真填寫單位資訊登記表,半年報表和一年報表,做到依法統計,真實記錄 在第六次人口普查中,擔任普查員,安排好社群21個普查小組的工作內容,指導完成普查小區電子地圖,並認真完成自...

衛生統計學》試卷

專業學號姓名得分 一 單項選擇題 每題2分,共40分 1 標準正態分佈的中位數為 a a.0 b.1 c.0.5 d.與標準差有關 2 2檢驗能分析d a.兩樣本率差異有無統計學意義 b.多個樣本率差異有無統計學意義 c.兩有序分類變數的關聯性d.以上都對 3 醫學試驗設計的基本原則是d a.對照 ...

《衛生統計學》課程複習

一 名詞解釋 1.計量資料 對每個觀察單位用定量的方法測定某項指標量的大小,所得的資料稱為計量資料。計量資料亦稱定量資料 測量資料。其變數值是定量的,表現為數值大小,一般有度量衡單位。2.計數資料 將觀察單位按某種屬性或類別分組,所得的觀察單位數稱為計數資料。計數資料亦稱定性資料或分類資料。其觀察值...