一、概率密度函数(Probability Density Function, PDF)
定义:描述连续型随机变量在某一区间内取值的概率密度,是曲线下面积表示概率的函数。
关键性质:
非负性: f(x) \geq 0 对所有 x成立。
归一性: \int_{-\infty}^{+\infty} f(x) dx = 1 ,即曲线下总面积为 1。
概率计算:随机变量在区间 [a,b]内的概率为 P(a \leq X \leq b) = \int_{a}^{b} f(x) dx 。
示例:正态分布的 PDF 为 f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} ,图像呈钟形曲线。
二、累积分布函数(Cumulative Distribution Function, CDF)
三、数学期望(Expectation)
四、标准差(Standard Deviation)
五、中位数(Median)
六、概念对比与应用场景
七、总结与延伸
这些概念共同构成了概率统计的基础:PDF 和 CDF 从分布形态角度刻画随机变量,期望和标准差从数值上量化中心趋势与离散程度,而中位数则提供了更稳健的中心位置度量。在实际应用中,可根据数据特性(如是否存在异常值)选择合适的指标 —— 例如,分析居民收入时,中位数比期望更能反映 “典型水平”,而科学实验数据的误差分析则常用标准差。