在科学研究中,经常要对收集到的数据进行各种统计分析,而分析数据时,大多使用较著名的统计分析软件包,如SAS,SPSS等。这些统计分析软件包功能强大,不仅能单变量分析,而且可做各种复杂的多变量分析。然而,在对数据进行处理时,大多是使用简单统计描述,画各种统计图表,或者进行t检验、方差分析、相关分析及回归分析。作这些统计分析时,大多可使用Windows95下的Excel 97。Excel是一种使用极方便的电子表格软件,它有强大的数据管理功能,能制作各种统计图表,具有丰富的财会和统计函数,并且Excel在“分析工具库”中,提供了一组数据分析工具。使用这些分析工具时,只需指出数据所在的单元格和提供必要的参数,该工具就会使用适宜的统计或工程函数,对数据做处理,给出相应的结果。有些工具在输出时还能产生图表。 单击“工具”菜单中的“数据分析”命令可以浏览已有的分析工具。如果在“工具”菜单上没有“数据分析”命令,应在“工具”菜单上运行“加载宏”命令,在“加载宏”对话框中选择“分析工具库”。 在进行两个样本均值相等假设分析时,可使用t-检验分析,根据情况选择:成对双样本均值分析、双样本等方差假设分析和双样本异方差假设分析。 1.t-检验:成对双样本均值分析 字串3 当样本中的观察值存在配对关系时,可以使用“成对双样本t-检验”。例如对一个样本组在实验前后进行了两次检测,为确定实验前后样本均值是否相等,应使用成对t检验,此t-检验并不假设两个总体的方差是相等的。 例如,用克矽平治疗矽肺患者10名,治疗前后血红蛋白含量如下: 治疗前 113 150 150 135 128 100 110 120 130 123 治疗后 140 138 140 135 135 120 147 114 138 120 在工作表中输入上面的数据,比如数据区为A1至K2。 分析时,在“工具”菜单中,单击“数据分析”命令。在数据分析对话框中,选择t-检验:成对双样本均值分析,拉出成对双样本均值分析对话框,其中有如下输入项(其他分析工具对话框内容和用法与之相似): 变量1的区域:输入需要分析的第一个数据区域的单元格引用。该区域必须由单列或单行数据组成。可单击输入框右面的按钮,回到电子表格上自数据开始的单元格向结尾的单元格拖动。此时变量1的区域(A1.K1)自动进入输入域中。然后单击输入域右面的按钮,回到原对话框。 字串3 变量2的区域:输入需要分析的第二个数据区域的单元格引用。该区域必须由单列或单行的数据组成。输入方法同前。变量2的区域为(A2.K2)。 假设平均差:在此输入期望中的样本均值的差值。缺省为0值,即假设样本均值相同。 标志:如果输入区域的第一行或第一列中包含有标志项,应选中此项:如果输入区域没有标志项,Excel将在输出表中生成适宜的数据标志。这里选中此项。 Alpha(α):在此输入检验的统计意义水平。该值范围为0~1之间。缺省为0.05。 输出区域信息可选择如下单选项: 输出区域:在此输入对输出表左上角单元格的引用。Excel会自动确定输出区域的大小并显示信息。可单击输入框右面的按钮,回到电子表格上,单击输出开始的单元格(如A3),然后再单击输入框右面的按钮,回到原对话框。 新工作表:可在当前工作簿中插入新工作表,并由表的 A3单元格开始粘贴计算结果。新工作簿:选此项,可创建一新工作簿,并在新工作簿的新工作表中粘贴计算结果。填完各项内容后,按“确定”按钮,即可在输出区域给出输出结果(表1)。
字串3 表1 成对双样本均值t检验分析结果 | 治疗前 | 治疗后 | 平均 | 125.9 | 132.7 | 方差 | 266.54 | 116.68 | 观测值 | 10 | 10 | 泊松相关系数 | 0.3186 | | 假设平均差 | 0 字串6 | | df | 9 | | t State | -1.307 | | P(T≤t)单尾 | 0.1119 | | t单尾临界 | 1.8331 | | P(T≤t)双尾 | 0.2237 | | t双尾临界 | 2.2622 | |
字串1 结论:因为P>0.05,故治疗前后血红蛋白均值差异无统计意义。
2.F-检验:双样本方差分析 字串1 此分析工具可以进行双样本F-检验,又称为方差齐性检验,用来比较两个样本总体的方差是否相等。例如,测得老年慢性支气管炎患者与健康人尿中17酮类固醇排出量如下。比较两组均数,进行F-检验,查看二者的样本方差是否相同。 患者 2.9 5.41 5.48 4.6 4.03 5.1 5.92 4.97 4.24 4.36 2.72 2.37 2.09 7.1 健康 5.18 8.79 3.14 6.46 3.72 6.64 4.01 5.6 4.57 7.71 4.99 在工作表中输入上面的数据。 分析时,在“工具”菜单中,单击“数据分析”命令。在数据分析对话框中,选择F检验,其他操作同成对t检验,给出如下结果(表2): 字串4 表2 双样本方差分析结果
| 健 康 | 患 者 | 平均 | 5.544545 字 | 4.377857 字串5 | 方差 | 3.048107 | 2.102187 | 观测值 | 11 | 14 | df | 10 | 13 | F | 1.449969 | | P(F≤f)单尾 | 0.2609 字串8 | | F单尾临界 | 2.671023 | |
3.“t-检验:双样本等方差假设”分析
此分析工具可以进行双样本t-检验。此t-检验先假设两个数据集的平均值相等。双样本等方差假设对话框与“成对双样本均值分析”对话框和用法几乎相同。 由于上面的数据经F检验知两总体的方差相等,故可做t检验,操作方法同“成对双样本均值分析”,得到如下输出: 字串5 表3 双样本等方差t检验分析结果 | 患 者 | 健 康 | 平均 | 4.377857143 | 5.528181818 | 方差 | 2.102187363 | 3.011616364 | 观测值 | 14 | 11 | 合并方差 | 2.497591276 | | 假设平均差 | 0 字串9 | | df | 23 | | t State | -1.80655051 | | P(T≤t)单尾 | 0.041967528字串8 | | t 单尾临界 | 1.713870006字串3 | | P(T≤t)双尾 | 0.083935057 | | t 双尾临界 | 2.068654794 | |
因P>0.05,故两样本均值差异无统计意义。 4.“t-检验:双样本异方差假设”分析 字串8 此分析工具应用于两个数据集的方差不等时,也称作t′检验。使用方法与前面相同,不再赘述。
|