本文作者:徐婷 顾经宇 叶新华 徐书航 吴阳 邵新宇 高远 刘德珍 陆卫平 华飞 施毕旻 梁军 许岚 唐伟 刘超 武晓泓
本文来源:中华内分泌代谢杂志 2016,32(12): 999-1002. DOI: 10.3760/cma.j.issn.1000-6699.2016.12.005
研究摘要
目的:比较甲状腺影像报告和数据系统 (TIRADS) 与 2015 年美国甲状腺学会 (ATA) 指南这 2 种超声模型在甲状腺结节良恶性病变鉴别诊断中的价值。
方法:选取江苏地区 7 个城市 8 家三级甲等医院至内分泌科门诊行甲状腺细针穿刺活检或甲状腺外科住院行手术切除的 639 例甲状腺结节患者病例。根据术前高分辨超声图像对结节进行 TIRADS 及 ATA(2015) 分级。构建受试者工作特征曲线比较 2 种模型的诊断价值。
结果:(1)纳入 639 例患者,847 例结节。男性 129 例,女性 510 例,平均年龄 (46.77±12.98) 岁。(2)818 例结节有 TIRADS 分级结果。TIRADS 2、3、4A、4B、5 的恶性比例分别为 0、15.9%、49.1%、78.8%、100%。(3)793 例结节可行 ATA 分级。极低度、低度、中度、高度可疑恶性的恶性风险分别为 6.2%、10.3%、24.9%、70.1%。(4)ATA 指南的特异性显著高于 TIRADS 分级 (77.9% 对 70.1%, P=0.001),而两者受试者工作特征曲线下面积、敏感性差异无统计学意义 (P=0.447、P=0.099)。
结论:在甲状腺结节良恶性病变的超声鉴别诊断中,TIRADS 具有较高的敏感性和曲线下面积,而 ATA(2015)指南超声模式的特异性较高。
甲状腺结节是一种常见的内分泌疾病,超声筛查的发现率高达 20%~76%,其恶性比例约占 5%~15%[1]。目前,超声检查已作为甲状腺结节的首选评估方法广泛应用于临床。2009 年 Horvath 等 [2] 提出了甲状腺影像报告和数据系统 (thyroid imaging reporting and data system, TIRADS),规范了甲状腺结节的超声诊断报告,逐步推广运用于临床。最近的 meta 分析显示,其诊断的敏感性、特异性及曲线下面积分别达到 0.79、0.71 和 0.92[3]。2015 年美国甲状腺学会 (American thyroid association, ATA) 指南 [4] 根据超声模式提出新的分级方法,其在中国人群中的诊断价值尚不明确。因此,本研究旨在比较上述 2 种超声诊断模型对本地区甲状腺结节良恶性鉴别诊断的效能,为临床运用提供依据。
对象和方法
对象
本研究为回顾性研究,数据来自于甲状腺结节临床评估及管理 (TEAM) 项目。选取 2014 年 1 月至 2014 年 8 月于江苏南京、常州、苏州、无锡、淮安、徐州、江阴 8 家三级甲等医院内分泌科门诊行甲状腺细针穿刺活检 (fine-needle aspiration biopsy, FNAB) 或甲状腺外科住院行手术切除的甲状腺结节病例,共 1,149 例。收集患者一般临床资料、甲状腺超声资料及 FNAB 细胞学结果或术后病理。
排除标准:(1) 甲状腺高分辨超声图像资料不全;(2)Bethesda 甲状腺细胞病理报告系统 (Bethesda system for reporting thyroid cytopathology, BSRTC) 结果或术后病理资料不全;(3)FNAB 不能明确结节性质 (BSRTC Ⅰ、Ⅲ、Ⅳ类);(4)BSRTC Ⅱ类未行 FNAB 或超声随访,或随访时间<1 年,最终纳入 847 例结节。恶性结节共 339 例,均由手术病理证实。手术确诊良性结节 321 例。187 例结节 FNAB 结果为良性 (BSRTC Ⅱ),随访 1 年后复查 FNAB 或超声,68 例 FNAB 结果仍为 BSRTC Ⅱ,119 例超声检查未见结节增大及性质改变,视为良性。
对所有入选结节的高分辨超声图像行 TIRADS 及 ATA 分级。本研究经医院伦理委员会审批通过 (2012-SR-058)。
TIRADS 及 ATA(2015) 指南超声模型分级
超声报告结果统一包括结节回声、性质、大小、边界、形态、钙化、声晕、后方衰减和纵横比。由同一位超声专科医师分析患者甲状腺结节高分辨率超声图像。
(1) 按照 Horvath[2] 提出的 TIRADS 分级标准将结节分为 TIRADS 2~5 级:①2 级:囊性结节伴或不伴彗尾征、海绵状结构;②3 级:桥本氏假结节;③4A 级:实性或混合性高/等回声结节,伴薄包膜;低回声结节伴边界不清,不伴有钙化;高/等/低回声结节,血流丰富,伴薄包膜,粗大或微小钙化;④4B 级:低回声伴有结节边缘不规则,伴或不伴钙化;⑤5 级:等/低回声结节,无包膜,外周微小钙化,血流丰富。
(2) 按照 ATA(2015) 指南超声模型 [4] 将结节分为 1~5 类:①1 类:良性,纯囊性;②2 类:极低度可疑恶性,海绵样或部分囊性结节,无任何高度、中度和低度可疑恶性的超声征象;③3 类:低度可疑恶性,等回声或高回声实性结节,无微小钙化、边缘不规则、甲状腺外侵犯和纵横比>1;④4 类:中度可疑恶性,低回声实性结节,不伴有微小钙化、甲状腺外侵犯和纵横比>1;⑤5 类:高度可疑恶性,实性低回声结节,伴有 1 个或多个以下特征:边缘不规则,微小钙化,纵横比>1,环形钙化伴有小的软组织突出,甲状腺外侵犯。
FNAB 与细胞学诊断
细针穿刺过程参考文献步骤 [5]。根据 BSRTC 进行细胞学诊断,结果分为Ⅰ~Ⅵ类,分别为:无诊断价值、良性、意义不明确病变、可疑滤泡性肿瘤、可疑恶性、恶性 [6]。
统计学处理
采用 SPSS 20.0 统计软件处理分析数据。连续变量用±s 描述,分类变量用率或比描述。两样本均数采用 t 检验或非参数检验,两组间率的比较采用χ2 或 Fisher 精确概率法检验。采用 MedCalc 11.4.2.0 统计软件,以手术病理、随访结果为参照,构建受试者工作特征曲线,采用 Youden 指数最大的点作为 TIRADS、ATA 分级最佳诊断点,计算得出 2 种诊断方法的敏感性、特异性、阳性预测价值、阴性预测价值、曲线下面积。采用配对卡方 McNemar 检验比较 2 种方法的敏感性、特异性、阳性预测值、阴性预测值。以 P<0.05 为差异有统计学意义。
结果
临床特点
本研究共入选 639 例患者,共 847 例结节。研究人群及结节的一般临床特征见表 1,男性、单发、颈部可触及淋巴结与恶性显著相关 (均 P<0.01)。恶性患者的年龄、结节直径大小显著低于良性患者 (均 P<0.01),FT4 水平高于良性组 (P=0.001)。
TIRADS 分级与病理结果对照
共有 818 例 (96.6%) 结节可以行 TIRADS 分级,结果如表 2 示。TIRADS 2 级共有 32 例,全部为良性 (100.0%),27 例 (84.4%) 由术后病理证实为良性,5 例 (15.6%) 经随访诊断为良性。TIRADS 3 级 371 例,其中 262 例 (70.6%) 有明确的术后病理,TIRADS 3 级的恶性比例为 15.9%。TIRADS 4A 共 218 例,107 例 (49.1%) 手术证实为状癌,68 例 (31.2%) 术后病理为良性,随访诊断良性结节 43 例 (19.7%)。TIRADS 4B 类 170 例,恶性比例为 78.8%。TIRADS 5 类的 27 个结节均由术后病理证实为恶性。
ATA 分级与病理结果对照
表 2 示 793 例 (93.6%) 结节的 ATA 分级结果。极低度可疑恶性为 32 例,良性为 30 例 (93.8%),其中 21 例由手术证实,9 例在随访过程中视为良性。低度可疑恶性为 184 例,良性为 165 例 (89.7%),其中 108 例由术后病理证实,57 例随访结果为良性。229 例为中度可疑恶性,手术证实恶性结节共 57 例 (24.9%)。高度可疑恶性结节共 348 例,恶性比例高达 70.1%。
TIRADS 分级与 ATA 分级诊断效能的比较
TIRADS 分级的最佳诊断点为 TIRADS 4A,其敏感性、特异性、阳性预测值、阴性预测值、曲线下面积分别为 82.0%、70.1%、64.6%、85.4%、0.813。ATA 分级的最佳诊断点为高度可疑恶性,其敏感性、特异性、阳性预测值、阴性预测值、曲线下面积分别为 75.9%、77.9%、70.2%、82.5%、0.794。两者曲线下面积差异无统计学意义 (P=0.447)。ATA 指南超声模型的特异性显著高于 TIRADS 分级 (P=0.001),而两者敏感性差异无统计学意义 (P=0.099,表 3)。
讨论
TIRADS 分级是目前甲状腺结节良恶性病变鉴别诊断中的最常用超声诊断方法。ATA(2015) 指南超声模型是最新提出的超声分类方法。本研究通过比较这 2 种超声模式,发现 TIRADS 的诊断敏感性、曲线下面积高于 ATA(2015) 指南超声模式,而 ATA 分级的特异性显著高于 TIRADS 分级。
超声检查是目前评估甲状腺结节的一线方法 [1]。微小钙化、低回声、不规则边缘、纵横比>1 及结节内部血流增加等超声特点与恶性有关 [7]。然而,不同研究关于预测恶性的超声特征有一定差异,单一图像预测恶性结节的价值并不可靠 [8]。因此,学者们通过多种超声特征的组合建立超声模型,以提高临床诊断效能。
2009 年 Horvath[2] 基于 10 种超声图像建立 TIRADS 模型 2~6 级,其推荐的恶性风险分别为 0、<5%、5%~10%、10%~80%、>80%、100%。并进一步在 1 097 个结节中验证,得出其诊断敏感性、特异性分别为 88%、49%。本研究中 TIRADS 3 类、4A 的恶性比例 (15.9%、49.1%) 均显著高于推荐范围,可能与本研究人群甲状腺结节恶性比例较高有关。
最近的一项囊括 10 437 例结节 TIRADS 的 meta 分析结果显示,TIRADS 的诊断敏感性、特异性分别为 0.79、0.71[3]。本研究针对 818 例结节,TIRADS 分级诊断的敏感性达 82.0%、特异性达 70.1%,与 meta 分析结果相近。本研究有 29 例 (3.4%) 结节无法进行 TIRADS 分级,包括低回声结节合并纵横比>1、部分囊性结节等。这部分结节的恶性比例为 41.4%,在 TIRADS 4B 推荐的恶性范围内。因此 TIRADS 未包括的图像特征的结节,其恶性风险较高,临床上对这部分结节的管理不容忽视。
2015 年新版 ATA 指南 [4] 根据超声图像将甲状腺结节分为 5 类,其恶性风险分别为<1%、<3%、5%~10%、10%~20% 和>70%~90%。本研究中各类结节的恶性风险均高于推荐范围,这可能也与本研究人群恶性比例较高有关。本研究未囊括 1 类纯囊性结节,因为其恶性风险极低,一般对这类结节不行 FNAB 或手术处理 [9]。
本研究中 54 例 (6.4%) 无法行 ATA 分级,大部分为高回声或等回声伴有边界不清、形态不规则、纵横比>1、微小钙化等 1 个或多个可疑恶性特征,而 ATA 指南超声模型并未涵盖这些图像特征。尽管多数研究认为等/高回声提示良性 [10,11],但 Seo[12] 认为实性等/高回声结节伴有钙化 (粗大钙化或微小钙化) 时,其恶性风险为 24.7%。并且根据 Horvath[2] 提出的 TIRADS 模型,当等回声无包膜结节伴微小钙化时,其恶性风险可超过 80%。本研究中,54 例未分级的结节中,恶性比例占 31.5%(17/54),提示等回声结节合并恶性超声特征时存在一定的恶性风险。最近一项关于 1 293 例结节 ATA 分级的研究显示,3.4% 的结节未能行 ATA 分级,其恶性风险为 18.2%[13];低于本研究,且其各个分级的恶性风险与本研究结果相比也偏低,这可能与研究人群的不同、超声医生的经验差异有关。
2015 年 Yoon 等 [13] 比较分析了改良版的 TIRADS 分级与 ATA(2015) 指南超声模式。研究发现 TIRADS 的敏感性、特异性、阳性预测值、阴性预测值分别为 97.4%、29.3%、23.3%、98.1%,ATA 分级的敏感性、特异性、阳性预测值、阴性预测值分别为 95.3%、37.4%、25.2%、97.3%。
与其研究结果相比,本研究 TIRADS 分级的诊断特异性、阳性预测值显著升高,但敏感性、阴性预测值偏低,这可能是由于:(1)2 个研究选用的 TIRADS 分级模型不同,Yoon 选用的是 2011 年 Kwak 等 [14] 提出的韩国改良版 TIRADS 模型,该模型根据实性、低回声、形态不规则、微小钙化、纵横比>1 可疑超声特征的数目进行分级;(2) 本研究的 TIRADS 最佳诊断点是通过构建受试者工作特征曲线,根据 Youden 指数最大点确定的,而 Yoon 直接选取 4A 作为最佳诊断点;(3) 研究对象本身的差异;(4)TIRADS 的观察者变异性。同样地,与 Yoon 研究相比,本研究 ATA 分级的诊断特异性、阳性预测值高,但敏感性、阴性预测值低,这可能也与截断点的选择、研究人群不同、超声医生经验的差异有关。
本研究发现 TIRADS 的敏感性、阴性预测值高于 ATA 分级,但特异性、阳性预测值较 ATA 分级低,与 Yoon 的结果类似,不同之处在于本研究中两者敏感性的差异无统计学意义。
综上所述,本地区多中心大样本研究发现,Horvath 提出的 TIRADS 模型诊断甲状腺结节的敏感性、曲线下面积稍高于 ATA(2015) 指南超声模型,而 ATA 分级特异性显著高于 TIRADS 分级。
本研究存在的不足:(1) 仅根据超声静态图像进行分级;(2) 入选人群中甲状腺结节恶性比例较高,但这种偏倚现象存在于多项研究,部分研究中研究对象恶性比例可达 34%[15,16];(3)22.1% 患者未经过手术证实病理类型,仅根据细胞学及随访结果判断其良恶性。因此,不同的超声分级模型在甲状腺良恶性结节鉴别诊断中的运用价值比较仍需在未来大量术后样本研究中进一步验证。
参考文献
[1] GharibH, PapiniE, PaschkeR, et al. American Association of Clinical Endocrinologists, Associazione Medici Endocrinologi, and EuropeanThyroid Association Medical Guidelines for Clinical Practice for the Diagnosis and Management of Thyroid Nodules[J]. Endocr Pract, 2010,16Suppl 1:1-43. DOI: 10.4158/10024.GL.
[2] HorvathE, MajlisS, RossiR, et al. An ultrasonogram reporting system for thyroid nodules stratifying cancer risk for clinical management[J]. J Clin Endocrinol Metab, 2009,94(5):1748-1751. DOI: 10.1210/jc.2008-1724.
[3] WeiX, LiY, ZhangS, et al. Meta-analysis of thyroid imaging reporting and data system in the ultrasonographic diagnosis of 10,437 thyroid nodules[J]. Head Neck, 2016,38(2):309-315. DOI: 10.1002/hed.23878.
[4] HaugenBR, AlexanderEK, BibleKC, et al. 2015 American Thyroid Association Management Guidelines for Adult Patients with Thyroid Nodules and Differentiated Thyroid Cancer: The American Thyroid Association Guidelines Task Force on Thyroid Nodules and Differentiated Thyroid Cancer[J]. Thyroid, 2016,26(1):1-133. DOI: 10.1089/thy.2015.0020.
[5] NikiforovYE, OhoriNP, HodakSP, et al. Impact of mutational testing on the diagnosis and management of patients with cytologically indeterminate thyroid nodules: a prospective analysis of 1056 FNA samples[J]. J Clin Endocrinol Metab, 2011,96(11):3390-3397. DOI: 10.1210/jc.2011-1469.
[6] CibasES, AliSZ. The Bethesda System for Reporting Thyroid Cytopathology[J]. Thyroid, 2009,19(11):1159-1165. DOI: 10.1089/thy.2009.0274.
[7] Woliński, SzkudlarekM, Szczepanek-ParulskaE, et al. Usefulness of different ultrasound features of malignancy in predicting the type of thyroid lesions: a meta-analysis of prospective studies[J]. Pol Arch Med Wewn, 2014,124(3):97-104.
[8] CooperDS, DohertyGM, HaugenBR, et al. Revised American Thyroid Association management guidelines for patients with thyroid nodules and differentiated thyroid cancer[J]. Thyroid, 2009,19(11):1167-1214. DOI: 10.1089/thy.2009.0110.
[9] LeeYH, BaekJH, JungSL, et al. Ultrasound-guided fine needle aspiration of thyroid nodules: a consensus statement by the korean society of thyroid radiology[J]. Korean J Radiol, 2015,16(2):391-401. DOI: 10.3348/kjr.2015.16.2.391.
[10] MoonHJ, SungJM, KimEK, et al. Diagnostic performance of gray-scale US and elastography in solid thyroid nodules[J]. Radiology, 2012,262(3):1002-1013. DOI: 10.1148/radiol.11110839.
[11] TrimboliP, GuglielmiR, MontiS, et al. Ultrasound sensitivity for thyroid malignancy is increased by real-time elastography: a prospective multicenter study[J]. J Clin Endocrinol Metab, 2012,97(12):4524-4530. DOI: 10.1210/jc.2012-2951.
[12] SeoH, NaDG, KimJH, et al. Ultrasound-Based Risk Stratification for Malignancy in Thyroid Nodules: A Four-Tier Categorization System[J]. Eur Radiol, 2015,25(7):2153-2162. DOI: 10.1007/s00330-015-3621-7.
[13] YoonJH, LeeHS, KimEK, et al. Malignancy Risk Stratification of Thyroid Nodules: Comparison between the Thyroid Imaging Reporting and Data System and the 2014 American Thyroid Association Management Guidelines[J]. Radiology, 2016,278(3):917-924. DOI: 10.1148/radiol.2015150056.
[14] KwakJY, HanKH, YoonJH, et al. Thyroid imaging reporting and data system for US features of nodules: a step in establishing better stratification of cancer risk[J]. Radiology, 2011,260(3):892-899. DOI: 10.1148/radiol.11110206.
[15] RagoT, SantiniF, ScutariM, et al. Elastography: new developments in ultrasound for predicting malignancy in thyroid nodules[J]. J Clin Endocrinol Metab, 2007,92(8):2917-2922. DOI: 10.1210/jc.2007-0641.
[16] BojungaJ, HerrmannE, MeyerG, et al. Real-time elastography for the differentiation of benign and malignant thyroid nodules: a meta-analysis[J]. Thyroid, 2010,20(10):1145-1150. DOI: 10.1089/thy.2010.0079.
本文来源:中华内分泌代谢杂志 2016,32(12): 999-1002. DOI: 10.3760/cma.j.issn.1000-6699.2016.12.005