跳转到主要内容

使用Microsoft Excel电子表格的Meta-Analyses和Forest Plots:逐步指南专注于描述性数据分析

摘要

背景

荟萃分析对于综合初级研究的数据是必要的,在许多情况下,对观察性研究的回顾是唯一可用的选择。通用统计包可以对数据进行元分析,但通常需要外部宏或编码。商业专业软件是可用的,但可能很昂贵,并且专注于特定类型的主要数据。大多数可用的软件在处理描述性数据方面都有局限性,而且对发病率和流行率等汇总统计数据的图形化显示并不令人满意。可以使用Microsoft Excel进行分析,但没有之前的指南可用。

发现

我们构建了一个逐步的指南,用于使用固定效果或随机效果模型在Microsoft Excel电子表格中执行元分析。我们还开发了第二种电子表格,能够生产定制的森林地块。

结论

只使用Microsoft Excel就可以进行元分析。更重要的是,据我们所知,这是第一次描述一种方法,该方法使用广泛可用的软件来生成统计上充足但在图形上吸引人的森林样地汇总描述性数据。

背景

荟萃分析和系统回顾是必要的,以综合从初级研究中获得的不断增长的数据。在Pubmed上只搜索文章的类型,Mesh术语“元分析”仅在2010年就会得到4223个结果。尽管对介入研究,特别是临床试验的回顾提供了最好的证据,但在一些情况下,观察性研究是唯一的选择。这些研究的荟萃分析变得越来越普遍,特别是在MOOSE报告发表后[1]。一些研究并不涉及对相对风险或差距的评估,而是重点放在发病率或患病率的概要统计数据上。

诸如SPS,STATA,SAS和R等通用统计包可用于执行META分析,但它不是它们的主要功能,因此它们都需要外部宏或编码。这些可以下载,但研究人员并不总是容易理解或定制。此外,前三个程序没有免费访问,价格从250美元到超过30,000美元,具体取决于版本和国家/地区。R是一个非常灵通的开源包,但它在健康中的使用仍然有限,大多数是对编程而不是点击界面的需要。

有一些软件包专门用于进行元分析。RevMan [2来自Cochrane协作是一个免费软件程序,要求研究人员填补系统审查的所有步骤。它只接受传统格式的效果大小。Metawin [3.]和综合元分析(CMA)[4.]是具有用户友好接口的商业软件。前者只接受三种类型的主要数据,而后者具有购买成本,但接受更多类型的数据。它可以执行高级分析,但是有关图形显示的仍然存在局限性,特别是描述性数据,因为CMA不允许定制产生的森林图。最后,还有Meta分析简单(混合)[5.], Excel的一个附加组件。它可以用来分析描述性数据选择输入类型为“连续”,但免费版本不允许分析原始数据,只建立在数据集。一些其他选项不再可用,如FAST*PRO [6.,其他的仍在开发中,作为元分析师[7.]。

另一种选择是使用直接Microsoft Excel分析数据。虽然它具有购买成本,但通常已经安装在大多数计算机中,捆绑在Microsoft Office包中。大多数研究人员都会感到不舒服,进入所有公式本身,因为它们起初可能看起来很复杂。但是,如果计算完成,Q和i等统计数据2可以使用基本算术运算计算。Borestein等[8.]引用生产森林地块作为一个重要限制的不可能,但我们开发了一种将散点图转变为统计上正确的森林情节的方法,允许研究人员利用所有Excel格式工具。我们的工作分为两个电子表格,因此研究人员可以使用两者都可以进行所有计算,或者只要他们已经分析了任何其他软件中的数据,而且需要一种吸引人的图形方式[附加文件1]。

发现

技术注释

此处描述的方法是在带有英特尔酷睿二级2.2 GHz处理器的笔记本电脑上设计的,运行Windows七个64位和Microsoft Office Excel 2007.电子表格在Excel 2003上进行了测试,计算或计算中没有差异图表。

Meta-Analyses的结果是效果摘要。但是,一些评论只能旨在结合率或普遍存存;从技术上讲,这些不能被称为“效果”,因为没有“导致”它,并且正确的术语将是单组摘要。我们将根据“结果”,以避免混淆,并仅维护缩写es.遵循教科书标准。

由于我们已经确定现有软件包的限制是处理描述性数据的,我们将在我们的示例中使用速率,以便最终森林图中的差异更加公开。该数据可能是一个国家吸烟或高风险患者心肌梗塞的发生率。我们选择使用理论数字,因此我们可以公开分发电子表格,测试特定公式并与其他软件获得的结果进行比较。所有公式都以传统方程式呈现,也是Excel格式。

步骤1和2始终需要根据研究类型和结果进行调整。电子表格1中的浅灰色列是要调整的柱子,而无论学习类型如何,深灰度的柱不需要任何修改(这包括指南的所有进一步步骤)。在方法书籍中可以轻松找到必要的调整[8.-10.]。

Cell B14应填充分析的研究数量。在选中鼠标指针在选定的单元格时弹出的电子表格上有注释,因此可以使用下载的文件而无需不断咨询完整的文章。虽然,在电子表格上不存在公式的解释和步骤的详细信息。Schriger等人最近发表的论文[11.]审查了300多份系统的审查报告,并强调了在制订这一办法时考虑到的生产森林地块的重要方面。

分析数据和生成森林地块的步骤

电子表格分析工作(图1

1.计算结果(效应量,es)

在我们的例子中,我们有B列和C列中的事件数和主题数,所以我们可以简单地计算D列中的速率为 N E. V. E. N T. S. N T. O. T. 一种 L. 或者D.3 =B.3 /C3在Excel中。与D3至D12相同,复制和粘贴将自动调整单元格号。应该为步骤1到6以及步骤9 B.1中的步骤1到6来完成此复制和粘贴。

图1
图1

电子表格1当前位置分析这个电子表格包含了分析所需的计算。浅灰色列的输入必须根据效果大小类型进行调整。深灰色列的计算对于任何效果大小类型都是一样的。

2.计算标准误差(SE)

所有SE都可以从公式中衍生出来 SE. = σ. X ̄ - μ 2 N ,但是有针对不同类型研究的简化导出方程。由于我们使用的费率,我们可以使用 SE. = es. es * n 或者 SE. = 活动 N ,与CMA所用的公式相同。在excel中是这样的E.3 =D.3 / sqrt(D.3 *C3)。

3.计算方差(var)

这个公式很简单:Var = SE2.在Excel中,F3 =E.3 ^ 2。

4.计算个别研究权重(W)

我们必须以逆转的反向重量每项研究,所以 W. = 1 S. E. 2 或者G3 = 1 /F3在Excel中。

5.计算每个计算加权效应大小(W * es)

计算方法是将每个效应量乘以研究权重。如果我们不使用任何对权重(即单效应模型)的修正,这个等式将再次导致某些类型研究的研究规模。在excel中,这是H3 =G3 *D.3.

6.其他必要的变量(W * es2和W.2

我们将需要另外两个变量来计算Q统计数据(电子表格1的列I和J)。在excel中,这将是一世3 =G3 *(D.3 ^ 2)和j3 =G3 ^ 2。

现在我们需要总结每个变量的所有值。在我们的电子表格中,他们在第14行,标有“ums”:G14 =G3:G12),H14 =H3:H12),一世14 =一世3:一世12),j14 =j3:j12)

7.计算Q.

Q测试测量研究之间的异质性,其工作原理类似于t测试。它被计算为单个研究效应和跨研究的合并效应之间差异的平方的加权和,权重是在合并方法中使用的那些。Q分布为卡方统计量,k(研究数量)减去1个自由度。零假设是所有研究都相等。为了验证这一点,我们需要计算Q并将其与一个临界值表进行比较。如果我们计算的Q低于表中的Q,那么我们没有拒绝零假设(因此研究是相似的)。

公式是 问: = σ. w *西文 2 - [ σ. w *西文 ] 2 σ. W. ,但在我们的电子表格中,它将简单B.17 =一世14 - ((H14 ^ 2)/G14)因为我们已经拥有了所有的总和。

8.计算我2

2提出作为量化异质性的方法,并且由于真正的异质性,即在研究之间的效果尺寸的效果大小的总变异百分比表达。公式是 一世 2 = 问: - DF. 问: * 100. ,“DF”代表“自由度”,只是研究总数(K)减去1.在Excel中,B.18 = ((B.17 -B.15)/B.17)* 100。

9.决定效果总结 E. ¯ S. ¯ 模型。

如果异质性低,我们可以使用固定效果模型,假设在我们的参数群体中的效果大小相同,并且研究的差异只是从采样错误。但是,如果我们认为我们的样本群体可能彼此不同,我们可以使用随机效果模型。许多研究人员也会选择这种模型,即使异质性低。在我们的示例中,Q高于16.919,在CHI方分布中发现9点自由度的临界值,以及我2是49%,所以我们有适度的异质性[12.]。我们必须决定数据是否可以进行元分析,如果是,我们可以选择进行随机效果模型。

  1. 一种。

    固定效应模型

我们的效果摘要是 E. ¯ S. ¯ = σ. w *西文 σ. W. , 或者B.20 =(H14 /G14).标准误差是 S. E. E. ¯ S. ¯ = 1 σ. W. , 或者B.21 =RAIZ(1 /G14).与之 S. E. E. ¯ S. ¯ 我们计算95%的置信区间,如 C 一世 E. ¯ S. ¯ = E. ¯ S. ¯ 1 96 * S. E. .在Excel中,B.22 =B.20 - (1.96 *B.21)和C22 =B.20 - (1.96 *B.21)。在我们的示例中,我们不会使用这些结果。

  1. B.

    随机效果模型

由于我们假定可变性不仅是由于抽样误差,而且是由于效应总体中的可变性,在这个模型中,每个研究的权重将以一个常数(V.)代表这个。

B1。公式是 V. = 问: - K. - 1 σ. W. - σ. W. 2 σ. W. .我们拥有所有这些信息,除了 σ. W. 2 .我们可以计算w2在列中j3 =G3 ^ 2,然后与J14 =的总和=索马j3:j12).现在,应用这个公式,m16 =(B.17 -B.15)/(G14 - (j14 /G14))。

B2。一旦我们有了这个常数,我们就可以计算每项研究的新重量,使用 W. V. = 1 S. E. 2 + V. .在excel中,L.3 = 1 / ((E.3 ^ 2)+ $m16美元)。我们需要$来修复单元格M16,或者当我们将等式复制到单元格L4到L12时,它将改变。

B3。现在我们重复步骤5到8,但使用我们的新重量V..结果在列M,N和O.应用Q和i2公式我们现在拥有可接受的Q和低异质性。我们计算了我们的效果摘要 E. ¯ S. ¯ V. = σ. W. V. * es. σ. W. V. ,标准误差为 S. E. E. ¯ S. ¯ V. = 1 σ. W. V.

在Excel:F20 =m14 /L.14,F21 =SQRT.(1 /L.14),F22 =F20 - (1.96 *F21)和G22 =F20 + (1.96 *F21)。置信区间比固定效应模型计算的置信区间要宽,但预期效果摘要变化不大。

在CMA中分析这些数字我们实现了完全相同的结果。- [其他文件23.]。

电子表格2森林图(图2

图2
图2.

电子表格2:Forest Plot此电子表格包含最终的森林情节。必须在使用电子表格1或任何其他分析软件之后手动输入数据。

列A-G具有研究信息。用户可以将每个研究效果大小和置信区间直接插入列D,F和G如果具有数据。在我们的示例中,我们复制了电子表格1的计算,以及随机效果模型效果摘要的值。

1.确保信息是我们想要显示的方式。在我们的示例中,我们希望百分比中的速率,所以列i =列D * 100。

2.我们通常将较低和上置信区间读为一个值,但Excel理解它与平均值的差异。这是获得适当的森林情节的关键。这些值是j2 =一世2 - (100 *F2)和K.2 =一世2 + (100 *F2)。再次,我们乘以100乘以百分比。

3.为了让每次研究不同的线路,我们将把序数分配给研究。如果我们希望它在图形的底部,我们的效果摘要必须是1号。这是手动在我们的电子表格列中完成的。

我们准备建立图表。插入>图>散点图。X值将是第i列,第2-12行和Y值列H,第2-12行。

5.我们现在必须添加误差条。在Excel 2007中,这是在布局选项卡中完成的,点击右边的“错误栏”按钮。在Excel 2003中,我们必须右键点击数据序列(图形上的点),然后点击“格式化数据序列”,然后选择“X错误条”选项卡。在这个窗口中,我们将选项标记为“个性化值”,然后将列J和K(第2行到第12行)分配为上下值。

6.为了插入标记汇总效果值的行,我们将添加另一个数据序列。首先,我们在电子表格中手动构建这个数据集。然后右键单击图形>选择数据。点击“add”,选择X值作为C列,第15行到第26行,Y值作为B列,第15行到第26行。一组新的点将出现在图表上。右键单击任何一个新点并选择“格式化数据系列”。然后我们将选择“无标记”和“实线”在标记选项和线颜色标签。

7.我们现在可以格式化X轴,右键单击它。在我们的示例中,我们希望它于10开始,结束28,间隔为2个单位。这不是我们的案例,但如果研究人员正在处理相对数据,则必须标记“对数标度”。

8.图表已准备就绪。用户可以格式化颜色,轮廓,阴影和大小。在我们的示例中,我们将摘要效果更改为钻石形状。这是通过仅选择一个点(双击)然后右键单击此操作完成。

9.对于演示文稿,我们建议在具有学习信息的表格上复制和粘贴图表(图3.)。

图3
图3.

使用我们的电子表格(左)和CMA(右)生成的森林样地的比较

结论

我们构建了使用电子表格对Meta分析数据感兴趣的帮助研究人员的指南。据我们所知,没有先前的逐步方法,但应该指出的是,所有公式和方法都是公开的。

分析电子表格中数据的主要限制是通过键入不正确的公式来误差的可能性。我们认为,作为本文中呈现的逐步的方法,其中包含以Excel格式的所有公式纳入其中的所有公式都可以帮助最小化这种可能性。呈现的指南也没有处理高级分析,例如多元回归。但是,这不是常常总结描述性数据。必须手动进行所有敏感性分析,包括并排除对效果摘要计算的每种研究,但这种限制也存在于其他软件中。

Microsoft Excel是Microsoft Office包的一部分,因此它不是没有成本。但是,对于那些已经拥有包装的人来说,这种Excel的这种使用可以放大其实用程序,为定制森林情节的图形呈现提供替代方案。

森林图的主要限制是所有研究都由相同尺寸的平方表示,而不是与研究重量成比例。我们没有觉得这可能会掩盖所有其他格式可能性,因为研究重量也可以通过置信区间宽度估算。

总之,使用Microsoft Excel电子表格对数据进行元分析是可能的,可以使用固定效应或随机效应模型。这种方法的主要优点是理解完整的过程和公式,并使用广泛可用的软件。使用excel制作森林图也是可能和简单的。由于显示结果在图形上吸引人,但也统计正确的方式通常是一个问题,大多数研究人员,我们相信这里提出的方法可能是非常有用的。数字3.将所得图与CMA软件进行比较。

可用性和要求

项目名称:使用Microsoft Excel电子表格的Meta-Analys和Forest Plots:专注于描述性数据分析的逐步指南;

项目主页:无;

操作系统:支持Microsoft Excel的任何操作系统;

编程语言:不适用;

其他要求:Microsoft Excel 2003或以上;

授权:知识共享署名3.0未移植(CC BY 3.0);

非学者使用的限制:无

支持数据的可用性

所提到的电子表格和用于比较统计数字的CMA文件是作为补充材料提供的。

参考文献

  1. 1.

    Strop DF,Berlin Ja,Morton Sc,et al。:流行病学观察研究的Meta分析:报告提案。流行病学观测研究的荟萃分析(驼鹿)组。贾马。2000,283:2008-12。10.1001 / jama283.15.2008。

    PubMed中科院文章谷歌学者

  2. 2.

    哥本哈根:北欧科克伦中心,科克伦协作,2011。审查管理器(RevMan)[计算机程序]。5.1版。[http://ims.cochrane.org/revman]

  3. 3.

    罗森伯格M:Metawin:Meta-Analysis第2版的统计软件2. 2000,Sunderland,Massachusetts:Sinauer Associates,[http://www.metawinsoft.com]

    谷歌学者

  4. 4.

    (1)综合元分析(第2版)2005, Biostat, Englewood NJ, [http://www.meta-analysis.com.]

    谷歌学者

  5. 5.

    Bax L, Yu L- m, Ikeda N,等:MIX:因果研究数据元分析的综合自由软件的开发和验证。《BMC医学研究方法》,2006,6:50-10.1186/1471-2288-6-50。

    PubMed公共医学中心文章谷歌学者

  6. 6.

    EDDY DM:FAST * PRO:通过置信剖面方法进行META分析的软件。1992年,学术出版社

    谷歌学者

  7. 7.

    Wallace Bc,Schmid Ch,Lau J等:Meta-Analyst:用于二进制,连续和诊断数据的Meta分析软件。BMC MED RES方法。2009,9:80-10.1186 / 1471-2288-9-80。

    PubMed公共医学中心文章谷歌学者

  8. 8.

    Borenstein M, Hedges LV, Higgins JPT等:meta分析导论。2009年,威利,1

    谷歌学者

  9. 9.

    Wilson D:实用元分析。2000, Sage出版社,1

    谷歌学者

  10. 10。

    《医疗保健系统综述:meta分析》,2001,中国医学杂志,2

    谷歌学者

  11. 11.

    Schriger DL, Altman DG, Vetter JA,等:系统性综述报告中的森林样地:一项回顾当前实践的横断面研究。流行病学杂志。2010,39:421-9。10.1093 / ije / dyp370。

    PubMed文章谷歌学者

  12. 12.

    HIGGINS JPT,THOMPSON SG,DEEKS JJ,ET AL:测量META分析中的不一致。BMJ。2003,327:557-60。10.1136 / BMJ.327.7414.557。

    PubMed公共医学中心文章谷歌学者

下载参考

确认

本研究由Concelho Nacional de Pesquisas(CNPQ)和FundodeventivoàPesquisadoClínicasde porto Alegre(Fipe-HCPA)提供资金。

作者信息

隶属关系

作者

通讯作者

对应到Jeruza L Neyeloff.

附加信息

利益争夺

作者们宣称他们没有相互竞争的利益。

作者的贡献

JLN构思了这篇文章,设计了电子表格,并起草了手稿。LBM和SCF修订了稿件并批准了最终版本。

电子辅料

13104 _2011_1382_moesm1_esm.xlsx

附加文件1:MS Excel中的Meta分析和林地块。此文件包含两个已开发的电子表格。(XLSX 26 KB)

13104 _2011_1382_moesm2_esm.pdf

附加文件2:CMA计算固定效果。这是通过固定效果模型计算效果摘要的软件综合元分析所执行的计算的便携式文档格式(PDF)。它提供给读者可以比较使用Microsoft Excel电子表格和商业软件得到的计算和结果。(PDF 822 KB)

13104_2011_1382_moesm3_esm.pdf.

附加文件3:CMA计算随机效果。当使用随机效应模型计算效应总结时,这是一个由综合元分析软件执行的计算的便携式文档格式(pdf)。它提供给读者可以比较使用Microsoft Excel电子表格和商业软件得到的计算和结果。(PDF 862 KB)

作者为图片提交的原始文件

以下是与作者的原始提交的图像的链接。

图1的作者原始文件

图2的作者原始文件

图3的作者原始文件

权利和权限

本文在BioMed Central Ltd.的许可下发布了这是一个开放的访问文章,根据Creative Commons归因许可(http://creativecommons.org/licenses/by/2.0)提供任何介质中的不受限制使用,分发和再现,所以提供了正确的工作。

再版和权限

关于这篇文章

引用这篇文章

使用microsoft excel电子表格的meta分析和森林图:关注描述性数据分析的分步指南。BMC RES笔记5,52(2012)。https://doi.org/10.1186/1756-0500-5-52

下载引用

关键词

  • 随机效应模型
  • 森林情节
  • 效果摘要
  • 研究重量
  • 加权效应大小