跳转到内容

離散型均勻分佈

本页使用了标题或全文手工转换
维基百科,自由的百科全书
離散型均匀分佈
概率质量函數
Discrete uniform probability mass function for n=5
n=5 where n=b-a+1
累積分布函數
Discrete uniform cumulative mass function for n=5
参数

值域
概率质量函数
累積分布函數
期望值
中位數
眾數 N/A
方差
偏度
峰度
矩生成函数
特徵函数

統計學概率理論中,離散型均匀分佈是一種離散型概率分佈,其所有可能的觀察值數量為有限整數,且每一個觀察值的出現機率皆相同。

離散型均匀分佈的一個例子是擲公平骰子,其可能的觀察值為1﹑2﹑3﹑4﹑5﹑6,而每一個數字的出現機率都是1/6。但若同時丟二個均勻骰子,將其值相加,就不屬於離散型均匀分佈,因為各個和的機率不同。

雖然離散型均匀分佈常用來描述觀察值為連續整數的分佈,例如前述的擲骰子範例,但實際上可以在任意有限集合上定義離散型均匀分佈,例如隨機置換英语random permutation就是由已知長度的置換中均勻隨機產生的組合,而均勻生成樹英语uniform spanning tree則是從給定的生成樹集合中均勻隨機抽樣得到的生成树

離散型均匀分佈在本質上是非参数(non-parametric)的。不過,當觀察值的範圍恰好是區間[a,b]之間的整數時,則a和b可以被視為該分佈的參數(也常常改為考慮區間[1,n],只保留一個參數n)。若用這種表示法,針對任意k ∈ [a,b]的累积分布函数(CDF)為

最大值估計

[编辑]

關於離散型均勻分佈的一個常見問題是德國坦克問題:假設從未知整數區間抽樣出個觀察值,目標是根據觀察值估計未知最大值的可能值。此問題於二戰期間被用於估計德國坦克產量。

在此問題中,最大值的均勻最小變異數無偏 (UMVU) 估計量為:

其中 m 是樣本最大值,k 是樣本大小,而且無放回抽樣。 這可被看作為最大間距估計的一個非常簡單的例子。

該估計量的變異數為:

因此,估計量的標準差大約為,也就是樣本之間差距的平均大小。

樣本最大值是總體最大值的最大似然估計,然而,該方法存在偏差。

若樣本沒有依序編號但可被識別或標記,則可透過標誌重捕法以估計族群規模。

隨機排列

[编辑]

有關均勻分佈隨機排列的固定點數量的機率分佈的說明,請參閱主條目。