有關統計學基礎中的樣本比例問題樣本方差公式p1p

2021-03-04 06:05:06 字數 4363 閱讀 6797

1樓:匿名使用者

比如說總體是班上有n個學生,n0個男生,總體比例π=n0/n,抽取的樣本量為n,求樣本比例的期望和均值。

解:不妨設x=樣本中抽到的男生數,由於抽到的人要不是男生,要不是女生,所以可以看成乙個二項分布,故x~b(n,π),令p為樣本比例,則p=x/n

e(p)=e(x/n)=nπ/n=π

d(p)=d(x/n)=dx/n^2=nπ(1-π)/n^2=π(1-π)/n

2樓:匿名使用者

假如總體為n個,含某種特徵的有x個,其所佔比例即為p=x/n

將問題轉換為兩點分布來看,這個群體中的個體,要麼含這個體徵,要麼不含。每個個體含這種特徵的概率為p,相當於該個體服從(1,p)的兩點分布。則均值為p,方差為p(1-p)。

所討論的樣本的比例根據大數定律和中心極限定律,統計量p(比例的均值或平均比例)近似服從n(p,p(1-p)/n)。(總體服從(μ,σ^2),則均值服從(μ,σ^2/n))

在統計學中的樣本量是如何計算的,置信度是如何計算的? 60

3樓:

您好!樣本量的計算公式為: n=z 2 ×(p ×(1-p))/e

z為置信區間、n為樣本容量、d為抽樣誤差範圍、σ為標準差,一般取0.5。e:

樣本均值的標準差乘以z值,即總的誤差p:目標總體佔總體的比例。(比如:

乙個班級中男生佔所有學生的30%。則p=30%)。

置信度是自己給的前提,不是算出來的。

比如:每個樣子在95%的置信度下的置信區間。就是用一種方法構造一百個區間如果有95個區間包含總體真值,就說置信度為95%(包含總    體真值的區佔總區間的95%)。

擴充套件資料

誤差值:是指由於隨機抽樣的偶然因素使樣本各單       位的結構不足以代表總體各單位的結構,而引起抽樣   指標和全及指標之間的絕對離差.因此,又 稱為隨機   誤差,它不包括登記誤差,也不包括系統性誤差。

影響抽樣誤差的因素:總體各單位標誌值的差異程度;樣本的單位數;抽樣的方法;抽樣調查的組織形式。

抽樣平均誤差:抽樣平均誤差是反映抽樣誤差一般水平的指標,它的實質含義是指抽樣平均數(或成數)的標準差.即它反映了抽樣指標與總體指標的平均離差程度.

抽樣平均誤差的作用首先表現在它能夠說明樣本指標代表性的大小.平均誤差大,說明樣本指針對總體指標的代表性低;反之,則高。

.置信區間:是指由樣本統計量所構造的總體引數的估計區間。

在統計學中,乙個概率樣本的置信區間(confidence interval)是對這個樣本的某個總體引數的區間估計。置信區間展現的是這個引數的真實值有一定概率落在測量結果的周圍的程度。置信區間給出的是被測量引數的測量值的可信程度,即前面所要求的「一定概率」。

這個概率被稱為置信水平。舉例來說,如果在一次**中某人的支援率為55%,而置信水平0.95上的置信區間50%,60%,那麼他的真實支援率有百分之九十五的機率落在百分之五十和百分之六十之間,因此他的真實支援率不足一半的可能性小於百分之2.

5。置信水平一般用百分比表示,因此置信水平0.95上的置信空間也可以表達為:95%置信區間。

置信區間的兩端被稱為置信極限。對乙個給定情形的估計來說,置信水平越高,所對應的置信區間就會越大。

4樓:小小盛

置信度就是用一種方法構造一百個區間如果有95個區間包含總體真值,就說置信度為95%(包含總體真值的區間佔總區間的95%)。

e:樣本均值的標準差乘以z值,即總的誤差。p:目標總體佔總體的比例。(比如:乙個班級中男生佔所有學生的30%。則p=30%)。

樣本量從總體中抽取的樣本元素的總個數。樣本量的計算公式為: n=z 2 ×(p ×(1-p))/e 2,其中,z為置信區間、n為樣本容量、d為抽樣誤差範圍、σ為標準差,一般取0.5。

5樓:山上那頭牛

樣本量從總體中抽取的樣本元素的總個數。樣本量的計算公式為: n=z 2 ×(p ×(1-p))/e 2,其中,z為置信區間、n為樣本容量、d為抽樣誤差範圍、σ為標準差,一般取0.

5。置信度就是用一種方法構造一百個區間如果有95個區間包含總體真值,就說置信度為95%(包含總體真值的區間佔總區間的95%)。

6樓:匿名使用者

1、樣本量

樣本量是從總體中抽取的樣本元素的總個數。樣本量的計算公式為: n=z 2 ×(p ×(1-p))/e 2,其中,z為置信區間、n為樣本容量、d為抽樣誤差範圍、σ為標準差,一般取0.

5。2、置信度

置信度是用一種方法構造一百個區間如果有95個區間包含總體真值,就說置信度為95%(包含總體真值的區間佔總區間的95%)。e:樣本均值的標準差乘以z值,即總的誤差。

p:目標總體佔總體的比例。(比如:

乙個班級中男生佔所有學生的30%。則p=30%)。

7樓:千山鳥飛絕

樣本量及置信度的計算公式為:

舉例:在上海進行一項抽樣調查以了解某種新服務方式的接受度,根據廠家反映,接受度為30%,廠家要求在95%的置信度下抽樣誤差範圍調查不超過正負4%,求該次簡單隨機抽樣的樣本量。

根據計算公式n=1.96*1.96*30*(1-30%)/(4%*4%)=504。

8樓:匿名使用者

統計學中樣本量是如何計算的?置信度是如何計算的?在這是乙個統計學中的問題,要找乙個高中的學統計的來告訴你怎麼做?

9樓:你豈知我是誰

置信度是根據自己的需求把握的。一般規定的置信度為68.27%,90%,95%,95.

45%,99.73%,有對應的概率的t,分別為1,1.64,1.

96,2,3。

當你做乙個調查時,你自己希望這個調查結果能夠達到置信度95%,那你在計算公式中就帶入95%和1.96。

樣本方差為什麼除以n-1

10樓:楓橋映月夜泊

為了保持標準偏差的無偏性。

換句話說,除以(n-1)後,樣本標準偏差的期望 = 總體的標準差.是無偏估計。

但除以n後,樣本標準差的期望 不等於 總體的標準差.是有偏估計。

如圖:拓展資料

先求出總體各單位變數值與其算術平均數的離差的平方,然後再對此變數取平均數,就叫做樣本方差。樣本方差用來表示一列數的變異程度。樣本均值又叫樣本均數。即為樣本的均值。

均值是指在一組資料中所有資料之和再除以資料的個數。

11樓:心雨潔思

在容量為n的總體中,假設我們已經通過隨機抽樣的方式獲得了乙份容量為n的樣本資料。現在我們有兩個任務需要完成:一是歸納樣本本身這n個資料之間的分布狀況;二是借助該樣本來推測總體的分布狀況,亦即嘗試以區域性推測總體、以偏概全。

出於簡便的考慮,我們經常僅僅借助均值和方差這兩個指標來簡略地描述樣本或總體的分布狀況。則對於第一項任務而言,為準確描述樣本資料間的離散程度,樣本方差計算公式中的除數應為"n」。類似地,為準確描述總體資料間的離散程度,總體方差計算公式中的除數應為"n」。

然而,如果我們準備借助樣本方差來推測總體的方差,則可以證明:以"n」為除數的樣本方差計算公式不是總體方差的無偏估計值計算式,而只有以"n-1」為除數的樣本方差計算公式才是總體方差的無偏估計值計算式。因此在推斷統計領域,樣本方差計算式的除數應為"n-1」,而不應為"n」。

當然,在n足夠大的時候,樣本方差這兩種計算方法之間的差異可以忽略不計。

最後,我將上述闡述歸納如下:

1. 設若總體資料已知,則該總體的數字特徵不存在推測的問題,只存在描述的問題,是故總體方差計算公式中的除數應為"n」。

2.  以"n-1」為除數的樣本方差計算公式是總體方差的無偏估計值計算式。

3.  以"n」為除數的樣本方差計算公式是總體方差的漸近無偏估計值計算式。

4.  如果只是要描述樣本資料間的離散程度,則樣本方差計算公式中的除數應為"n」。

5.  當n足夠大的時候,不必太在意樣本方差計算公式中除數的這兩種不同的選擇。

6.  在多數場合,習慣上總是採用以"n-1」為除數的樣本方差計算方式。

論證如下:

同學不理解的地方可以繼續提問哦》0《滿意的話請採納吧^-^

12樓:星

如果只計算這些樣本的偏差,那麼直接除以n。如果要反推整個系統的偏差,就除以n-1.

因為抽樣計算的平均值肯定跟全部系統整體資料平均有差別,均方差也會有差別。要估算的話,根據概率分布等公式擬合反推, n-1是比較吻合的(資料比較多時)

13樓:鎮美媛革鶯

自由度的問題。在n個中隨機選,選了n-1個,剩下的乙個是確定的了,不能再選。所以除n-1,小生才疏學淺,還望拋磚引玉。嘿嘿,我們認識不誒,mai生人

關於申請美國統計學基礎數學phd的問題

你應該繼續學經濟或精算,你的條件很好,申請數學院也有希望的。數學phd是在乎的幾門科目,你成績都很好的。獎學金,是要取決於你的gpa,語言成績等等。無需國內再讀2年了。其實經濟學在美國的前途挺好的。但是不喜歡是一回事的。你有專業研究領域嗎?如果有,管他統計學還是數學,在美國大學裡找相同領域的教授,只...

統計學中的power值是指什麼,統計學中的均值指的是什麼

power是指power of test statistic,是 來統計量的 源統計檢驗bai力 統計檢驗能du力 power of a statistical test 1 是在零假設為假應該被拒絕的情zhi況下,假設檢驗拒dao絕的概率。與犯第二類錯誤的概率互補的部分,1 稱為統計檢驗能力。1 ...

關於醫學統計學的問題,學習醫學統計學能解決什麼問題

大哥,三組資料不能用t檢驗了,不能用兩兩比較,因為每兩兩比較一次就會人為的劃分一次a置信度,a錯誤的概率就會增加!三組資料,如果你的資料實驗組,對照組,空白組。那實驗組,對照組,空白組 就設定輸入實驗組1,對照組2,空白組3這樣。血液指標就對應輸入就可以了!然後就是方差分析 f檢驗 analyse分...