跳转到主要内容

Brecahad:乳腺癌组织病理学注释和诊断的数据集

抽象的

目标

病理学家的组织病理学分析决定了大多数肿瘤的诊断和预后,如乳腺癌。为了评估癌症的侵袭性,病理学家根据与患者预后相关的形态学特征来评估活检组织样本的显微外观。

数据描述

本文介绍了一个包含162张乳腺癌组织病理图像的数据集,即乳腺癌组织病理标注与诊断数据集(BreCaHAD),该数据集允许研究者对所提出的方法进行优化和评价。该数据集包括各种恶性病例。该数据集的任务是自动将苏木精和伊红(H&E)染色图像中的组织结构分类为6类,即有丝分裂、凋亡、肿瘤核、非肿瘤核、小管和非小管。通过向生物医学影像领域提供该数据集,我们希望鼓励计算机视觉、机器学习和医学领域的研究人员贡献和开发方法/工具,以自动检测和诊断乳腺癌组织图像中的癌变区域。

客观的

病理学家的组织病理组织分析在许多类型的癌症(例如乳房)的诊断和预后起着重要作用。分段和分级系统可能因不同类型的癌症而有所不同。乳腺癌是最常见的癌症类型之一;它有自己的评分系统。诺丁汉分级系统(也称为ELSTON-ELLIS [1修改Scarff-Bloom-Richardson [2渐变系统是基于三个主要特征,即核渗透,管状形成和有丝分子计数的乳腺组织等级广泛使用标准,每种核粘性术,管状统计数为1至3点。将这三个特征的分数加到一起以确定总体最终得分(在3-9的范围内)和乳腺癌的等级。然而,以高精度手动发现和注释受影响的区域,以高精度被视为癌症诊断和分级中的黄金标准,但它也是一种耗时和繁琐的任务,需要大量的努力,专业知识和经验病理学家。这些技能主要通过分析更多案例随着时间的推移获得。然而,这种视觉解释具有严格的准则,它为组织学分析带来了一定的主观性,因此导致互生/口腔内变异性[3.4和一些重复性问题。此外,这些问题可能直接影响患者的预后和治疗计划。这些问题可以通过在数字化组织病理学中开发自动化图像分析工具来缓解。由于图像采集和分析技术的快速发展,它不仅可以给病理学家提供更多的见解,而且可以指导病理学家发现和分级感染病例。这些定量计算工具的目的是提高质量的病理研究人员有关的速度和准确性。

因此,必须为定量和定性分析开发自动评估工具,以帮助去除该缺点。然而,由于组织制剂中的固定,嵌入,切片和染色步骤产生大量的伪影和差异,因此组织的组织病理学检查仍然是一个具有挑战性的问题。产生大量的伪影和差异[5].此外,核在大小、形状、位置、纹理等方面的变化使自动检测成为一项繁琐而困难的任务。我们相信,来自不同案例的各种注释将有助于提供关于这些具有挑战性的情况的足够好的信息。

数据描述

在本文中,我们提出了名为Brecahad的乳腺癌组织病理学图像的数据集(表1,数据集1),可向生物医学成像社区公开使用[6].这些图像是从存档的外科病理案例中获得的,存档是为了教学目的。诺丁汉分级系统(Nottingham Grading System)是世界卫生组织(World Health Organization)推荐的一种国际乳腺癌分级系统,通过对三种形态特征(小管形成、核多形性和核分裂计数)的评估来评分,以决定癌症病例的最终分级。为了得到这些特征,病理学家将H&E染色的组织学图像标注或标记为有丝分裂、凋亡、肿瘤核、非肿瘤核、小管和非小管。样本病例来自不同的场景,从边界清晰的组织结构到缺乏典型特征的低分化结构。

表1数据文件/数据集概述

Brecahad DataSet包含微观活检图像,其在未压缩(.tiff)图像格式中保存,每个通道中具有8位深度的三声道RGB,并且尺寸为1360×1024像素,每个图像都被注释(见表1,数据文件2-3)。这些注释是有丝分裂,细胞凋亡,肿瘤核,非肿瘤核,小管和非小管。它们用于评估三种形态特征,即核渗透,管状形成和有丝分裂数。此外,乳房组织活检载玻片用于产生样品用苏木精和曙红(H&E)染色。相同的获取条件和设置用于从组织样本载玻片中获得0.514μm×0.527μm,每像素0.514μm×0.527μm的数字化图像,相机在40×目的捕获700微米,通过1360×芯片捕获700微米的微观图像。 1024 pixels. The images were captured under brightfield illumination with a Zeiss 40× oil objective on a Ziess Axiophot microscope through a 10× magnifier to a Spot Pursuit PR3440 camera controlled by Spot v5.2 software. While an automatic exposure mode is selected for the camera, the focusing is done manually for each slide.

所有标本都是固定在10%中性缓冲福尔马林(pH7.4)中的乳房组织12小时,用梯度乙醇/二甲苯加工成血糖蛋白。根据标准程序,将所有部分用4微米厚度,脱氨碱化和含有1%曙红染色的。标本已从2至20年归档,因此染色和颜色特征的轻微差异反映了随着时间的推移使用的程序和试剂。该数据集目前含有四种恶性肿瘤(乳腺癌):导管癌(DC),小叶癌(LC),粘液癌(MC)和管状癌(TC)。在表中可以在表中找到先前提到的六个类中的注释分发和Brecahad数据集的注释格式1,数据文件1。

Brecahad DataSet的注释以JSON(JavaScript对象表示法)格式提供。在给定的表中1,数据文件4,JSON文件(地面真理)包含两种有丝分裂,只有一个肿瘤核注释。这里,xy是注释对象的质心的坐标,并且该值在[0,1]之间(除以图像的宽度和高度)。

通过提供这个数据集用于研究目的,我们希望促进乳腺癌组织病理学的计算机辅助诊断的研究。因此,研究人员可以优化和证明他们提出的方法的有效性,同时实验这个数据集。

限制

由于相机造成的图像像素/图像色调范围有限,随着时间的推移不同批次的苏木精导致颜色略有差异,100×油物镜和浸没油介质的光学分辨率作为这些图像是为了反映实际的外科病理图像通常用于诊断外科病理学家评估乳腺活组织检查。此外,无法获得每个病例的总体分级评分,每张图像也不包括导管癌、小叶癌、粘液癌或管状癌的分类标签。

缩写

BreCaHAD:

乳腺癌组织病理学注释和诊断数据集

他:

苏木精和伊红

DC:

导管癌

LC:

小叶癌

MC:

粘液癌

TC:

管状癌

JSON:

JavaScript对象表示法

参考

  1. 1.

    Elston CW,Ellis IO。乳腺癌病理预后因素。I.乳腺癌组织学等级的价值:长期随访的大型研究的经验。组织病理学。1991; 19(5):403-10。

    CAS文章谷歌学术

  2. 2.

    绽放HJG,Richardson WW。乳腺癌的组织学分级和预后:1409例,其中359例持续15年。BR J癌症。1957; 11(3):359。

    CAS文章谷歌学术

  3. 3.

    Robbins P,Pinder S,De Klerk N,Dawkins H,Harvey J,Sterrett G等人。乳腺癌组织学评级:Interobserver协议研究。哼唱道。1995年; 26(8):873-9。

    CAS文章谷歌学术

  4. 4.

    Friderson HF,Wolber Ra,Berean KW,Franquemont DW,Gaffey MJ,Boyd JC等。Interobserver缺乏渗透导管癌的植物和Richardson组织学分级方案的诺丁汉修改的再现性。AM J Clin Pathol。1995; 103(2):195-8。

    文章谷歌学术

  5. 5.

    Wynnchuk M.最大限度地减少组织处理中的伪影:第2部分组织处理理论。汉诺威步行:Maney Publishing Suite;2013年。

    谷歌学术

  6. 6。

    AKSAC A,Demetrick DJ,Özyert,Alhajj R.Brecahad:乳腺癌组织病理学注释和诊断的数据集。娇养。2018年。https://doi.org/10.6084/m9.figshare.7379186.

下载参考

作者的贡献

AA,To和Ra启动和设计了这项研究。DJM准备并组织了DataSet。AA写了稿件。to,djm和ra校对手稿。所有作者都致力于修订。所有作者阅读并认可的终稿。

确认

不适用。

相互竞争的利益

提交人声明他们没有竞争利益。

数据资料的可用性

本数据注意中描述的数据可以在图中自由而公开地访问https://doi.org/10.6084/m9.figshare.7379186.6].请参见表1并提供详细的参考列表和数据链接。

同意出版

不适用。

伦理批准并同意参与

本研究涉及匿名信息和图像,无法识别相应的个体。艾伯塔省的健康研究伦理委员会(Hreba.cc-17-0631)授予必要的道德批准。本研究中使用的数据被收集用于患者的常规诊断。它在卡尔加里大学准备和数字化。没有干预患者进行研究目的。

资金

不适用。

出版商的注意事项

188金宝搏牛牛技巧《自然》杂志对已出版的地图和附属机构的管辖权主张保持中立。

作者信息

隶属关系

作者

通讯作者

对应于艾珀阿克拉克

权利和权限

开放获取本文在知识共享归属4.0国际许可条款下发布(http://creativecommons.org/licenses/by/4.0/)如果您向原始作者和源给出适当的信用,则允许在任何介质中进行不受限制的使用,分发和再现,提供指向Creative Commons许可证的链接,并指示是否进行了更改。Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)除非另有说明,否则适用于本文中提供的数据。

重印和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用这篇文章

Aksac,A.,Demetrick,D.J.,Ozyer,T.等等。Brecahad:用于乳腺癌组织病理学注释和诊断的数据集。BMC RES笔记12日,82(2019)。https://doi.org/10.1186/s13104-019-4121-7

下载引用

关键词

  • 乳腺癌
  • 组织病理学
  • H&E染色
  • 注解
  • 诺丁汉组织学分数
  • 数据集