中位数

统计学中的专有名词
中位数(Median),又称中值。指一组观察值,按大小顺序排列,位置居中的变量值 (n为奇数)或位置居中的两个变量值的均数(n为偶数)。中位数是一个位次上的平均指标。[3][11]
中位数概念最早出现在六世纪的《塔木德》,但未广泛流传。此后中位数在部分著述中被提及,但都没有明确算法及应用,且并未得到普及。[12][5][13]直到1774年,法国数学家拉普拉斯(Pierre-Simon Laplace)明确建议使用中位数作为后验概率密度函数(PDF)值的标准估计量,以最小化预期误差。[4][14]1843年,法国数学家安东尼·奥古斯丁·库尔诺(Antoine Augustin Cournot)首次使用中位数(valeur médiane) 一词来表示将概率分布分成相等的两半的值。[6]
在一组观测值的数据中,大于
的个数和小于
的个数相等;此外,当
与某一定值
离差绝对值(也称绝对离差)之和,以
=
时为最小。[15]中位数表明总体中标志值小于中位数的单位数和大于中位数的单位数是相等的。用中位数来代表总体的一般水平可以避免受总体中极端标志值的影响,有时更具有代表性。[16]
中位数可以应用于任何定量资料,通常用于不适合用几何平均值和调和平均值的偏态资料中,尤其适用于包含不完全信息的资料中。其具体可以应用在生活、医学及计算机等领域,如临床上随访资料经常包含一些中途失访患者的某些数据;在生活中,中位数能够反映考试分数集中趋势的量。[17][18]

定义