跳至主要内容

如何在Excel中计算Z分数:全面指南

Author: Amanda Li Last Modified: 2025-05-07

在统计学和数据分析领域,了解数据与平均值的比较情况至关重要。z分数(也称为标准分数)提供了一种方法,用于衡量数据点相对于数据集均值的相对距离,并以标准差为单位表示。无论您是在分析考试成绩、财务数据还是其他任何数值型数据集,计算z分数都可以为您提供关于数据行为的深刻见解。

使用Excel计算z分数具有简单高效的特点,能够快速分析大型数据集,从而实现标准化比较和异常值检测。本教程将引导您了解什么是z分数、如何在Excel中找到它、提供公式示例、解释数据中的z分数,并分享在进行这些计算时需要记住的重要提示。

A screenshot of the generic formula to calculate z-scores

什么是z分数?

z分数(也称为标准分数)是一种统计指标,用于量化特定数据点与数据集均值之间的距离,并以标准差为单位表示。这一测量对于理解数据点偏离数据集平均值的程度和方向(高于或低于)至关重要。本质上,z分数将数据点转换到一个通用的尺度上,使不同数据集或不同群体之间的比较变得简单明了,而无需考虑原始测量尺度或分布形状。

z分数的概念与正态分布密切相关。正态分布是统计学中的一个基本概念,代表一种大多数观测值聚集在中央峰值附近的分布,且从均值开始向两侧对称递减的概率分布。在正态分布的背景下:

A diagram illustrating the normal distribution curve in statistics

  • 大约68%的数据落在均值的一个标准差(±1 z分数)范围内,表明与平均值的偏差适中。
  • 约95%的观测值位于两个标准差(±2 z分数)范围内,显示显著但并非极端的偏差。
  • 几乎99.7%的数据都落在三个标准差(±3 z分数)范围内,涵盖了分布中的几乎所有观测值,并突出了极端偏差。

z分数是统计分析中的重要工具,使研究人员和分析师能够将来自不同数据集的个体观测值标准化,从而促进来自不同分布的分数比较。通过将数据转换为z分数,可以轻松确定特定观测值在给定分布中的异常程度或典型性,使其成为包括异常值检测、假设检验和数据归一化在内的各种应用中不可或缺的工具。


如何在Excel中找到z分数?

在Excel中,没有单一的专用函数可以直接计算z分数。该过程涉及先计算数据集的均值(μ)和标准差(σ)。在获得这些关键统计数据后,您有两种主要方法来确定z分数:

  • 手动计算方法:应用z分数公式:
    =(x-μ)/σ
  • 其中:
  • x 是您正在检查的数据点,μ 是数据集的均值,σ 是数据集的标准差。
  • 使用STANDARDIZE函数:为了更集成的方法,Excel的 STANDARDIZE 函数根据数据点、均值和标准差作为输入直接计算z分数:
    =STANDARDIZE(x, mean, standard_dev)

在Excel中计算z分数的公式示例

假设您在A列中有一个数据集,范围从单元格A2到A101,以下是计算这些值的z分数的方法:

  1. 计算均值(μ:使用 AVERAGE(区域) 函数找到均值(μ)您的数据集。
    =AVERAGE(A2:A101)
    A screenshot showing how to calculate the mean using the AVERAGE function in Excel
  2. 计算标准差(σ:根据您的数据上下文选择适当的公式。
    重要提示:为您的数据集选择正确的函数对于确保精确计算至关重要。(对于我在A2:A101中的数据,代表整个总体,我将使用第一个公式。)
    • 使用STDEV.P(区域) 函数,如果您的数据代表整个总体(意味着这些值不是从更大的群体中抽样而来)。
      =STDEV.P(A2:A101)
    • 使用 STDEV.S(区域) 函数,如果您的数据是一个更大总体的样本,或者您想基于样本估计总体标准差。
      =STDEV.S(A2:A101)
      A screenshot showing how to calculate the standard deviation using the STDEV.P function in Excel
  3. 计算A2中数据点的Z分数:使用以下任一公式,它们将产生相同的结果。(在这种情况下,我将选择第二个公式。)
    • 手动计算 通过从数据点中减去均值并将结果除以标准差。
      =(A2 - $E$2) / $E$3
    • 使用 STANDARDIZE(x, mean, standard_dev) 函数。
      =STANDARDIZE(A2, $E$2, $E$3)

      注意:美元符号($)告诉公式始终引用特定单元格(E2为均值,E3为标准差),无论公式复制到哪里。

      A screenshot showing how to calculate a z-score for a single data point in Excel

  4. 计算数据集中每个值的Z分数:将步骤3中的公式向下复制到列中,以计算数据集中每个值的z分数。 提示: 双击单元格的填充柄以快速扩展公式。

    A GIF showing how to copy the z-score formula down a column in Excel

提示:
  • 为了在整个数据集中简化z分数的计算,而不必在单独的单元格中分别键入均值和标准差的公式,您可以直接使用以下任一综合公式。
    =(A2 - AVERAGE($A$2:$A$101)) / STDEV.P($A$2:$A$101)
    =STANDARDIZE(A2, AVERAGE($A$2:$A$101), STDEV.P($A$2:$A$101))
  • 在科学和统计工作中,保持小数点后三位的一致精度是值得称赞的做法。通过选择您的z分数单元格并利用“减少小数”选项(在“主页”选项卡上的“数字”组中找到)来实现这一点。

    A screenshot of the Decrease Decimal option in Excel for formatting z-scores to three decimal places


解读数据中的z分数

解读z分数对于理解数据点在数据集中的位置和重要性至关重要。z分数提供了元素与数据集均值之间相差多少个标准差的直接测量,揭示了其相对位置和稀有性。

与均值的关系
  • Z分数 = 0:表示平均表现,数据点正好在均值处。
  • Z分数 > 0:表示高于平均水平的值,距离均值越远,表示表现越强。
  • Z分数 < 0:表示低于平均水平的值,较低的分数标志着更大的偏离均值。
偏离程度
  • |Z分数| < 1:这些数据点接近平均值,在正态分布的主要数据体内,表示标准表现。
  • |Z分数| < 2:表明与均值有适度偏离,标记为不常见但仍处于正常范围内的方差。
  • |Z分数| > 2:突出显示显著远离均值的异常数据点,可能指示离群值或与预期规范的重大偏离。

示例说明:

  • z分数为0.66意味着数据点比均值高出0.66个标准差。这表明该值高于平均值,但仍相对较接近,属于典型的变异范围内。
  • 相反,z分数为-2.1表示数据点比均值低2.1个标准差。该值显著低于平均值,表明它远离典型范围。

在Excel中计算z分数时需要注意的事项

当使用Excel计算z分数时,精度和准确性至关重要。为了确保结果的可靠性,有一些关键注意事项需要牢记:

  • 检查正态分布:z分数对于符合正态分布的数据最为有效。如果您的数据集不符合这种分布,z分数可能不适合作为分析工具。在应用z分数分析之前,考虑进行正态性测试。
  • 确保正确使用公式:根据您的数据集特征,确保选择正确的标准差函数——STDEV.P用于整个总体,STDEV.S用于样本。
  • 对均值和标准差使用绝对引用:在跨多个单元格应用公式时,在z分数公式中对均值和标准差使用绝对引用(例如,$A$1),以确保计算的一致性。
  • 注意异常值:异常值对均值和标准差都有显著影响,可能导致计算出的z分数出现偏差。
  • 确保数据完整性:在计算z分数之前,确保您的数据集干净且无错误。不正确的数据输入、重复项或无关值会显著影响均值和标准差,导致误导性的z分数。
  • 避免过早四舍五入或截断:Excel可以处理大量的小数位数,保留这些小数可以防止累积的舍入误差,以免扭曲最终分析。

以上是所有与在Excel中计算z分数相关的内容。希望您觉得本教程有所帮助。如果您想探索更多Excel技巧,请点击这里访问我们包含数千个教程的广泛集合。