协和医学杂志(增刊) ・产 科・ 诊断性二代测序指南 通过二代测序(next-generation sequencing,NGS) 能够快速对某个个体患者的数千个甚至数百万个DNA 碱基对进行测序。这一技术的快速出现并且获得成 功,预示着遗传学诊断新的时代的到来。但是,新技 术也带来了新挑战,一方面是技术层面上的,即数据 提供了潜在的全方位获益。暂时还不能将这项技术应 用于诊断的原因在于其质量较差,尚不能给病人提供 足够的验证试验,目前也不能接受其应用于临床 诊断。 声明I:根据目前的指南,NGS尚不能应用于临 处理问题,另一方面是对结果和后续遗传咨询方面问 题的解释,而所有这些都会涉及到对NGS在诊断方面 的精确定位问题,无论今天还是明天都是如此。在着 手购置诊断性NGS机器以及有关技术之前尚有许多问 题需要处理。基于上述情况,诊断性NGS指南应运而 生。该指南主要解决NGS检测在罕见的和主要的单基 因遗传病方面的问题,集中于对基因集合的靶向分析 方面,通过特异性捕获检测或是从全外显子测序中提 取数据。原则上说,全基因组分析可能很快会被应用 以提取相类似的数据,但全外显子测序也能够检测到 疾病的其他分子特征,因此其应用会更加广泛。 有3个研讨会讨论了关于诊断}生NGS各个方面的 问题。第1次研讨会于2013年2月25 Et一26日在 Leuven举行,其初步观点于2013年3月7日~8日在 Prague举办的欧洲基因检测科学大会上发布。第2次 研讨会是编辑研讨会,于2013年10月1日~2日在 Leuven举行,来自各个层面的人汇集在一起讨论并起 草有关文件,第1版文件于2013年11月21日~22日 在Nijmegen举办的第3届研讨会之前完成。最后一次 研讨会邀请了更多的利益相关者来对这个文件进行评 价并形成声明。最终的文件被提交到欧洲人类遗传学 会理事会,并于2015年7月1 Et获得认可。 本文所呈现的是在撰写指南过程中出现的声明, 这个声明对指南进行了更加广泛的阐述,可以作为指 南的补充材料。这个补充材料同时包括了定义和一般 介绍,更重要的是,还包括了一些实际的病例和 模板。 二代测序技术发展水平 从某种意义上说,可靠的NGS技术平台尚不稳 定,因为NGS的技术和应用变化频繁且快速。但是, 这并不妨碍将这项技术应用于诊断,因为NGS给病人 44 October.2016 床实践,因为尚无一项可接受的验证试验方法。 必须事先明确诊断试验的目的是为了除外某种诊 断还是为了确认某种诊断,因为这两者之间存在显著 区别。这一区别主要取决于测试的完整性,这不但要 求有不同的设置,更重要的是对诊断的不同看法。 声明2:实验室必须明确其所提供的检测是用于 除外某种诊断,还是用于确认某种诊断。 二代测序诊断/临床应用 将NGS应用于诊断的优势是可以在相对较短的时 间内以相对较低的费用对很多个基因进行一次性检 测,从而产生更多的分子诊断。 NGS的局限性取决于其所采用的平台和富集方 法,要想获得高质量的诊断,在检测之前必须考虑到 这两方面的问题,因为这对富集方法、测序平台的选 择以及还需进行的额外测试均有影响。 声明3:必须在验证试验开始之前就讨论确定需 要采用哪些试验或分析方法,以及采用这些试验或分 析方法的目的,并将讨论摘要写入验证报告中。 “诊断产出”被定义为检出某种致病性变异并从 而得出分子诊断的几率,通过每个病人队列计算得 出,主要是从临床层面来评价NGS的表现,也是评价 该检测效率及其临床应用价值的重要指标。 声明4:实验室若考虑将NGS应用于诊断,首先 必须考虑其诊断产出。 在实践工作中,诊断试验往往倾向于提供基因集 合。当考虑实施诊断性试验时必须定义将某一个基因 纳入到集合中所需具备的条件。在理想的情况下,这 个问题应该在一个专业学会的层面上、通过多学科讨 论的方式来解决,其目的是要给所有诊断试验编撰一 个基因名单,更重要的是要协调各种遗传学检测方 法。当然,从病人和医学从业者的角度来看,能够通 协和医学杂志(增刊) 用并且获得同等价值则尤为重要。 声明5:对诊断目的而言,只有那些异常基因型 和表现型之间的关系已经明确的基因(无论是通过已 发表的论著还是通过验证)才能被纳人分析。 那些与缺陷的主要部分相关的基因被称为“核心 基因”,其敏感性不会因为从Sanger测序转化为NGS 而受到影响。一个强有力的例子就是BRCA1和 BRCA2基因,通过Sanger测序再加上缺失/重复分析, 关的疾病。 NGS的检测结果主要基于主动发现和次要发现的 几率,主动发现来自于和所检测疾病相关的基因中, 而次要发现来自于和所检测疾病病因不相关的疾病基 因中。 声明9:诊断实验室的分析渠道应集中在被研究 的基因集合中,以避免产生次要发现,并且进行相应 的验证。 其敏感性可以达到99%。这一点也同样适用于其他诊 在一个基因集合中产生主动发现的几率很低,这 断产出很高的基因。增加其他基因无疑可以增加诊断 产出,但这不能以漏检为代价。因此,能够增加多少 检出率就成为确定核心基因名单的关键性决定因素。 声明6:为避免不可靠的检测并兼顾病人的利益, “核心基因名单”应由临床和实验室专家共同制定。 实验室会不考虑指南的规定而采用不同的NGS检 测设置(技术性的和诊断性的),事实上,也确实存 在很多不适配于指南的各种情况。因此,研究者提出 NGS诊断的评分标准,对不同的实验室进行公平打分 和简易比较。 (1)A类检测:实验室可以保证>99%的可靠参 照要求或对不同编码区域和侧翼内含子区域的测序要 求,用Sanger测序方法(或其他补充测序分析方法) 来填充所有的缺口,并可以利用所采用的平台来进行 额外分析,如均聚物延伸分析。 (2)B类检测:实验室明确描述哪些区域达到 >99%的可靠参照要求或其他测序要求,用Sanger测 序方法填充部分缺口。 (3)c类检测:完全依赖于NGS本身的质量,不 提供任何额外的Sanger测序或其他测序分析方法。 声明7:采用基于覆盖率和诊断产出的简单评分 标准可以对不同的实验室所提供的诊断检测进行 对比。 知情同意以及提供给病人和临床医生的信息 基于NGS的诊断性试验的应用取决于试验步骤、 所采用的平台、滤过程序、以及实验室所采用的数据 储存方法。因此,应充分告知咨询医生这一遗传学检 测的局限性以及可能由此带来的不良后果。 声明8:实验室必须对每一次NGS试验都提供以 下信息:靶向疾病、所检测基因的名称、已报道的检 测范围、分析的敏感性和特异性,如果可能的话,还 包括由于所检测基因的突变所导致的和临床表型不相 主要取决于所涉及的基因。但有可能会检测到隐性情 况下的杂合突变,因此而检测到携带者。这将会对遗 传咨询、生育选择等产生影响。 声明10:实验室应提供产生主动发现的几率方面 的信息。 在实施一个基于NGS的试验之前,临床(遗传 学)中心需要建立一个“主动发现和次要发现规范”, 该规范必须和伦理委员会的决议相一致,且必须在实 验室、研究所或国家层面上被决定。无论病人是选择 性接受还是拒绝接受在最初诊断结果以外的信息,这 个规范均应详细说明是否应报告主动发现和携带者状 态,且实验室应明确其可以管理好各种不同的意见。 声明1 1:如果一个临床中心或实验室决定给病人 提供关于选择性接受或拒绝接受不相关疾病携带者状 态和次要发现结果的选择权时,需要涵盖所有有关的 可能性。 同时,必须进行检测前遗传咨询,内容应该包括 对预期结果以及可能出现的主动发现和次要发现进行 的讨论。咨询必须提供足够多的信息。 声明l2:应向病人清楚说明关于对主动发现和次 要发现的实验室政策。 声明13:推荐通过书面的单张或在线方式向病人 提供足够的信息。 二代测序技术验证 样本的质量牵涉到很多方面的参数,例如数据的 数量、PCR扩增及覆盖的比例。要达到诊断的目的, 则只针对高质量的样本进行分析,因此就必须确定高 质量的靶基因集合、外显子或基因组。 声明14:所有用于诊断的关于NGS质量的参数必 须被精确描述。 NGS技术要求对运行、分析及样本的特异性特征 分别进行监测。监测数据不必报告但应用于持续的验 Vo1.7增刊45 协和医学杂志(增刊) 证中。 是需达到国家要求并符合常识。 声明22:诊断性实验室必须采取措施以保证对所 有相关数据进行长期储存。 在进行任何分析前必须定义临床目标,即所有的 编码区域加上保守剪切位点。临床目标的确定则依据 诊断试验和限定的基因集合而定。 声明23:在试验过程中必须确定报告的范围,即 声明15:诊断性实验室必须针对以下三个方面建 立相关质量检测的结构性数据库:(1)检测平台; (2)所有分析;(3)所有样本。 用于NGS工作流程的样本追踪方法非常复杂,涉 及到实验室部分和计算机分析中的多个步骤。 声明16:对分析的评估应包括样本追踪和样本鉴 别条码设定的各个方面,也包括在平台验证的内容。 在平台验证中,实验室必须确认其所有设备和试 能够获得可靠结果的临床目标,而且必须告知临床医 生(通过报告形式或数字通讯方式)。 剂都必须满足制造商的要求。必须发现各个实验室自 身的局限性并且在检测和数据分析过程中充分考虑到 这些因素。实验室应区分这些问题是来自检测平台环 节、测试特异性环节,或数据分析环节。 声明17:一般平台验证部分应包括准确性和精确 性验证,这一工作不必在每次测试中重复进行。 显然,每个测序技术都有其优势和劣势,生物信 息工具必须反映出这些特征。 声明18:生物信息流程必须和所采用的技术平台 相符。 诊断特异性的验证流程必须采用分析的灵敏度和 特异度来进行评估。例如,适用于SNP检测的计算方 法对于小的插入或缺失就不够准确。实验室必须明确 这些特征,并且充分测试各种不同的检测流程。 声明19:必须针对分析灵敏度和分析特异度分别 建立不同的验证流程。 任何有关化学、富集步骤、生物信息学分析平台 方面的改变都必须经过重新验证。 声明20:如果生物信息学流程(公共工具或商业 软件包)发生改变,诊断性实验室必须用标准数据集 对其进行验证。 所有相关变量的内置数据库提供了用于鉴别平台 特异性产物的工具,对验证结果进行追踪,并提供了 对位点特异性数据库和荟萃分析的互换。这一数据库 应允许进一步的注解(如假阳性、已发表的突变、分 离变量等),从而使诊断过程更加合理。 声明21:诊断实验室必须针对现行的相关变量建 立结构数据库。 数据的储存必须坚持用标准开放式文件格式 FASTQ,BAM和VCF,可用于和其他实验室进行数据 交换。当储存分析结果时,必须同时储存full—log文 件。1og文件应尽可能完善,使得从FASTQ数据到诊 断报告的分析都可复制。遗憾的是,目前尚无一个关 于数据储存方面的国际共识,对数据储存的普遍共识 46 October,2016 声明24:对“可报告范围”的要求依据分析目的 而定。例如,目的是获得高诊断产出的外显子测序就 不需要进行以获取在全基因组范围内高覆盖率为目的 额外分析,却需要和临床医生明确沟通说明,这一检 测不能用于除外某一种特定的临床诊断。 必须通过准确性、分析灵敏度、分析特异度、精 确性这些指标来评价诊断性试验的表现。原则上讲, 这些都不是新要求但却普遍被认为不易操作。但是, 针对这方面的国际化标准是非常严格的。 声明25:无论何时对试验做出重大变更都应该检 查质量参数,必须重新检测样本。实验室应事先确定 好改进或升级方法时要对哪种类型的样本以及多少样 本量进行重新分析。 二代测序报告 NGS的结果应以清晰的方式发放,因为读实验室 报告的人包括非专业人员。从实践的立场来说,有临 床意义的结论、相关性试验、以及试验质量数据,应 该在首页上特别标示出来。 所有病理性(5类)和可能病理性(4类)变异 都应报告。是否报告未分类变异(UVs一3类)则根据 各实验室的实际情况而定,但实验室研究人员和临床 医生均须明确这些情况。 声明27:实验室自身的政策必须和国际指南保持 一致,对于报告的基因变量,实验室应在对其提供分 析之前就明确界定,并记录在案。 声明28:必须收集UVs的数据,目的是最终对这 些变异进行明确分类。 需要一个团体来收集和共享已知的数据,目的是 最终将这些变异归类为病理性(5类)或良性 (1类)。 实验室或研究所对主动发现和次要发现所采取的 策略必须能够反映在实验室日常工作和报告中。 协和医学杂志(增刊) 声明29:实验室应该在开始试验之前建立明确的 步骤来阐述主动发现和次要发现。 鉴于这一领域中新的发现和进展,诊断性实验室 不应由于分析“旧”数据而超负荷。实验室只提供在 现阶段已知的和已验证的结果。 声明30:不应期待实验室去系统性重新分析旧的 数据并报告新的发现,即使当核心疾病基因集合已经 发生改变也不应如此。 从另一方面讲,在一个特定的时刻,应由这一疾 病的实验室或团体的专家来将某一变异从某一级别更 改至另一级别,实验室则应负责重新分析可靠的数 据,在新的证据基础上重新发放报告,重新联系开单 临床医生,因为病人很可能会受到该变异的新的状态 的影响。在这种情况下,应该有一个体系来将病人和 变异关联起来,当变异被重新分类之后检索受累 病例。 声明31:为了能够管理好疾病变异,实验室应建 立自己的针对不同疾病的变异数据库。 研究和诊断的区别 随着全基因组检测用于诊断和研究的可能性逐渐 增加,诊断和研究之间的分界就逐渐模糊起来,因 此,阐述清楚对于诊断性资料、我们能做什么、应该 做什么及需要签署哪一种类型的分析特异性研究知情 同意书,都是非常重要的事情。这并不排除对诊断性 结果作进一步研究的建议,但是,在任何情况下都应 该明确区分诊断和研究。 声明32:诊断性试验是指任何~种直接回答和病 人的医疗情况相关的临床问题的试验。 声明33:研究性试验是指提出~个假说,其结果 可能会和该计划中入组病人之间存在有限的临床相 关性。 声明34:诊断性试验的结果,尤其是全外显子或 全基因组分析的结果,可以产生自某个假说。 如果诊断性试验的目的是为了获得一个遗传学诊 断、且其分析仅限于那些已知和某种疾病相关的基 因,在诊断过程中采用获自NGS的外显子或基因组数 据是可以被接受的。 声明35:如果诊断性试验的主要目的是给某一个 病人作出诊断,那么该试验应该在认证实验室进行。 当病人及其家属参加某一个研究计划时,他们必 须要明确这样的计划可能会获得和某种遗传性疾病相 关的诊断或预测性信息。在研究中,临床相关性的结 果只能在获得诊断性试验确认之后才能发送至病人的 医疗记录中。 声明36:在将研究性结果发送给病人之前必须在 认证实验室确认该结果。 为了使对变异的解释更加容易,大多数实验室会 给所有在自己实验室进行测序/分析的样本(理想的 情况是有健康的父母)的变异频率建立数据库。这样 的数据库不包括任何敏感信息,基于隐私规则的考虑 也不权衡这些数据对提高诊断水平和改善健康保健的 重要性。 声明37:所有在诊断性或研究性试验中获得的健 康个体的变异频率都应被分享。 在理想的情况下,所有检测到的和疾病相关的基 因变异都应该发送到病理性变异的数据库中,并且将 其与病人的临床资料相关联,同时也要明确描述变异 分类的标准和争议。 声明38:所有报道的变异都应该发送至联邦、地 区、国家、和/或国际数据库中共享。 参考文献 [1]Matthijs G,Souche E,Alders M,et a1.Guidelines for diag. nostic next—generation sequencing[J].Euro J Hum Genet, 2016,24:2-5. (戚庆炜编译) Vol 7增刊47