Differentiation
Abstract
间质干细胞(MSCs)向成骨细胞的分化是骨发育和动态平衡的一个完整的部分,当它被不恰当地调控时,可能产生疾病,比如骨癌或骨质疏松。利用无偏倚的高通量方法,我们描述了在人类MSCs向骨谱系分化的过程中,基因表达,组蛋白修饰,以及DNA甲基化方面整体改变的图景。此外,我们第一次提供了一份基因组范围上的,关于骨主要调控转录因子Runt相关转录因子2(RUNX2)在人类成骨细胞中DNA结合位点的描述,显示出目标基因与增殖,迁移及凋亡调控有关,并与p53调控的基因有明显的重叠。这些发现扩展了正在出现的证据,这些证据是关于RUNX2在癌症,包括骨代谢,以及p53调控网络中有作用的。我们进一步揭示了RUNX2结合在远端的调控元件,启动子上,还有很高的频率结合在基因的3’末尾上。最后,我们识别出了TEAD2和GTF2I是一种新的成骨调控因子。
Introduction
间质干细胞或者基质细胞(MSCs)有多谱系潜能,可以向成骨,成脂,成软骨,还有其它谱系分化(1)。MSCs出现在骨髓和其它间质组织中,可能迁移到损伤或炎症处,参与组织修复(2)。MSCs可在体外条件下被纯化并向成骨细胞分化,这为从分子上研究成骨提供了方便的工具(1)。关于这一过程的更多知识,对基础研究及MSCs在骨骼再生医学上的临床应用都是十分重要的(3),同样地,理解它在骨病中失调的情况也很重要,比如说癌症。在这点上,非常有意思的是骨肉瘤,最常见的骨原发恶性肿瘤,可能是由基因及表观遗传上的改变打断了MSCs向成骨的分化所致(4)。
干细胞分化受基因表达的变化所高度调控,这种变化在转录水平上与DNA或染色质结合在转录调控子上有关,或是与染色质图像的局部改变有关(5~7)。高通量方法的发展,比如RNA测序(RNA-Seq),以及染色质免疫沉淀及测序(CHIP-Seq),使人们可以对这种改变。在基因组水平上进行描述(8,9)举例来说,RNA-Seq可以系统性地发现启动子与外显子的轮流使用(10),而CHIP-Seq显示特定的组蛋白修饰区域,以及这些变化是如何改变基因活性的(5,8)。CHIP-Seq也使人们可以发现基因组结合位点,并为广泛的转录因子(TFs)寻找目标基因(11,12)。此外,综合基因组分析可以在整个基因组中识别功能区域,比如启动子和增强子,这些成果又可以被用来丰富新的转录因子结合位点(TFBS)分布,以帮助发现新的生物过程调控因子(5)。
在单倍体RUNX2缺乏患者中的骨骼发育缺陷(13),或是Runx2缺合子(nullizygous)小鼠中骨化骨的缺失(14,15),揭示了RUNT相关转录因子2(RUNX2,即CBFA1)对于骨的发育是不可或缺的。在成骨中,RUNX2涉及调控增殖,迁移,定型,以及向成骨谱系的分化(16~19)。RUNX2对上游信号起反应,调控基因的表达,这些上游信号包括TGFB,BMP及Wnt信号通路(20~23);但是,成骨细胞中的下游目标被描述得就没有那么好。除了它在发育和失调中的作用,RUNX2还为人所知的是涉及肿瘤形成;RUNX2与MYC原癌基因协同,在造血谱系中启动瘤变发生(24),近期的证据提示在乳腺癌和前列腺癌细胞中,RUNX2的肿瘤生长和代谢属性(25~27)。在骨肉瘤中,RUNX2常常是过度表达的,这与预后不良有联系(28)。有趣的是,关于RUNX2和p53相互作用的证据开始浮现,包括因DNA损伤
所致的RUNX2抑制p53介导的基因表达(29),以及p53依赖性RUNX2蛋白水平调控的证据(30)。
我们描述了从非肿瘤生成性,不死化的MSC细胞系向成骨分化过程中的转录组及表观基因组上的特征。此外,我们第一次报导了骨主要调控因子RUNX2在人类成骨细胞中的基因组范围的结合位点,并揭示了2000多个目标基因,这些目标基因为研究骨生物学中RUNX2的转录调控作用提供了新的亮光。我们也利用组蛋白CHIP-Seq产生的表观基因组特点来识别与分化诱导性染色质改变有关的启动子,并预测TEAD2和GTF2I是这些启动子的新调控因子。最后,通过沉默TEAD2和GTF2I的表达,我们确认了这些转录因子在调控成骨分化方面的作用。
Materials and Methods
暂略
RESULTS
iMSC#3细胞向成骨谱系分化引起基因表达的整体改变
为了研究从MSCs开始的成骨分化,我们使用了我们实验室产生的非肿瘤形成性细胞系(iMSC#3),办法是通过端粒酶的异位表达(Skarn et al.,manuscript submitted for publication)从而不死化。这个细胞系可以受转录操控,并且在多次传代后仍然有多谱系分化潜能。甚至,在基因表达水平上,iMSC#3细胞非常像人原始MSCs,提示细胞的不死化没有彻底改变它们的MSC特性(Supporting information Fig.S1)。为了成骨,iMSC#3细胞被放在DM中培养28天,强力茜素红S染色提示矿化基质形成(Fig.1A)。为了进一步检验分化的程度,用RNA-Seq技术从未分化细胞(Day 0)和分化细胞(Day 28)中测定了基因整体表达情况,并做对比。我们所发现的在分化中上调或下调的转录物,其所对应的基因分别为1462个和1695个,幅度至少是2倍或更多(Fig.1B)。复制实验显示出高水平相关性(Supporting information Fig.S2)。使用精巧路径分析(IPA),我们发现上调基因与增殖,细胞死亡,骨骼发育,以及细胞运动相关,而下调基因与细胞周期调控有关(Fig.1C)。已知的成骨标志物,包括ALPL(碱性磷酸酶),RUNX2,ATF4(活化转录因子4),OMD(骨调蛋白),以及FOXO1(叉头框O1)被发现是上调的,而MSC标志物,包括MCAM(黑色素细胞黏附分子),ENG(内皮糖蛋白),CLCF1(心肌营养蛋白样细胞因子1),TPM1(原肌球蛋白1α),以及CD44(CD44分子[印度血型])被发现是下调的(Fig.1D)。
分化iMSC#3细胞的表观遗传分布
为了研究成骨过程中基因组范围的表观遗传改变,我们在0天和28天时,利用CHIP-Seq描述了代表着染色质不同功能状态的组蛋白H3修饰的分布情况。我们检验了H3K4m3的分布,它在启动子中很丰富(8,36),H3K9ac和H3K27ac的分布,它们在活化调控元件中很丰富(37,38),H3K36m3的分布,发现于活化的已转录基因中(36),以及抑制性修饰H3K27m3的分布,典型情况下它分布广泛,覆盖启动子,编码区,以及基因间区(8,39)。关于0天和28天时ALPL位点的CHIP-Seq及RNA-Seq富集分布图已给出(Fig.2A)。该图显示转录水平下调,这与H3K4m3和H3K36m3分别在启动子和编码区的富集程度上升相一致。多个H3K27ac及H3K9ac峰提示转录元件活化,而在基因的上游发现H3K27m3甲基化受抑制
(Fig.2A)。
分化伴有染色质图景的变化
为了从整体上分析组蛋白修饰的改变,我们计算了整个基因组中读取区域相对于500bp区域的倍数变化(Day 28/Day 0)(the fold changes of reads aligning to 500bp regions throughout the genome was calcuated)。总的来说,我们发现分化诱导的H3K4m3,H3K9ac,H3K27ac,以及H3K36me3的富集显示出正相关性,而抑制性甲基化的改变很大程度上与活化标志物的改变呈负相关(Fig.2B)。我们进一步发现分化的诱导伴随着全基因组范围上的H3K9及H3K27的乙酰化缺失,而H3K4m3和H3K27m3的总体水平仍然相对恒定(Fig.2C; 所有区域)。把这种分析限定在基因启动子周围,我们发现乙酰化总体上缺失,但不是基因组范围上的,而H3K27m3富集程度在启动子处是总体上升高的(Fig.2C; ±2kb of 5’)。H3K4m3在启动子处的富集率保持不变(Fig.2C; ±2kb of 5’)。启动子区域数量很大,显示组蛋白富集程度在相应基因转录水平未发生变化的情况下增加或减少了(Fig.2D)。特别是,数千个启动子处乙酰化的减少,伴有H3K9和H3K27之间极大范围的重叠(数据未给出),影响那些涉及基因调控,细胞生存,生长,以及增殖的基因(Fig.2D,2E)。有趣的是,在其启动子处H3K27m3水平增高或降低的基因,与肿瘤发生有很强的关联。H3K27m3富集程度的增加与神经系统发育有很强的关系(Fig.2E)。对H3K4m3,其富集程度增加与发育过程相关,而降低与细胞周期有关(Fig.2E)。
一般来说,表达上调与H3K4m3,H3K9ac以及H3K27ac富集程度增加呈正相关(Supporting information Fig.S3)。对H3K27m3的变化与基因总体水平上的表达情况之间没有发现什么相关性(Supporting information Fig.S3),分别只有131个上调的基因和81个下调的基因在其启动子区域显示出明显的富集程度变化(数据未给出)。IPA分析发现这些基因功能上没有明显的富集。
除了组蛋白修饰,我们还研究了0天和28天时,450000个CpG位点上DNA甲基化的总体变化,使用的是HumanMethylation450 BeadChIP试验。这种试验覆盖了99%的Refseq基因,每个基因平均覆盖17个CpG位点。我们发现只有1273个CpG位点的甲基化状态发生了改变,其中1121个位点甲基化程度降低,152个位点甲基化程度增高。甲基化状态变化与710个基因相关,平均每个基因1.7个CpG位点,只有27个受影响的基因超过了2个CpG位点(Supporting Information Fig.S4; Supporting Information Table S4)。因此,DNA甲基化保持着相对恒定,在控制MSCs向肿瘤生成方向分化方面,没有表现出重要的调控作用。
RUNX2基因的替代性转录变异
已知RUNX2是成骨分化的主要调控者,我们更详细地研究这个基因的表达情况。在0天细胞中,通过RNA测序发现主要的转录源自P1启动子(Fig.3A)。在诱导分化时,上游的P2启动子受诱导,正如从第28天的两个第一外显子(first exon)RNA测序数据增加所显示的那样(Fig.3A)。另外,第28天时P2启动子处的H3K4m3,以及在P2和P1启动子之间的编码区域中的H3K36m3富集程度的增加,支持了P2转录起始位点的分化诱导性激活(Fig.3A)。TaqMan qPCR,使用覆盖两个不同外显子连接处的引物(如Figure 3A,3B所示),证实了P2启动子的转录显著增强,而P1启动子只有轻微的增加(Fig.3C);但是,没有发现蛋白质水平上的增加(Fig.3D)。有趣的是,位于RUNX2基因外显子2和外显子3之间的一个非RefSeq但却被ENCODE注释过的外显子,其表达情况受到了分化的诱导(Fig.3A, 3B; 星号)。包含这一外显子的转录产物没有被任何下游的外显子读取,RNA-Seq队列数据(Supporting
Information Fig.S5)证明了这一点,并且成为来自RUNX2位点的上调转录产物的重要部分。这段与ENCODE注释的转录产物(Fig.3A)相应的短RNA功能位置,但预计编码蛋白质。
从基因组范围上描述成骨主要调控因子RUNX2的结合位点
为了识别成骨细胞中的RUNX2目标基因,我们用针对RUNX2的单克隆抗体做了ChIP-Seq,以找出分化的iMSC#3(第28天)细胞中基因组范围上的结合位点。为了确认,我们还在原始NHOst成骨细胞中做了RUNX2 ChIP-Seq。在iMSC#3细胞中通过标记50kb区域内最近的5’末端(by annotation to the closest 5’ gene end within a 50kb region),发现了总数为9549的RUNX2区域(Supporting Information Table S5)。结合位点分布在接近基因的位置,以及远处(Fig.4A)。在第28天的iMSC#3细胞内500个最富集的峰值点中的92%,以及第28天的细胞内4000个最富集的峰值点中的76%,在NHOst细胞中也是富集的(Fig.4B)。从头计算(De novo)模体发现在RUNX2峰值处产生了一个模体,与RUNX家族模体序列有99%相同,这进一步支持了RUNX2的特定富集(Fig.4C)。
我们发现了2167个ENSEMBL与RUNX2结合的基因,结合位置在5’末端或3’末端的±2kb内,并把这些基因定义为RUNX2目标基因(Supporting Information Table S6)。RUNX2目标基因的IPA分析显示这些基因与分子和细胞功能高度显著相关,这些功能涉及细胞生长与增殖,细胞运动,细胞死亡与生存,发育,以及细胞装配与形成组织(Fig.4D, Supporting Information Table S7A)。我们发现癌症相关功能基因富集程度很强(Fig.4D Supporting Information Table S7B);包括识别出了IPA数据库中已知是p53调控网络中一部分的154个RUNX2目标基因(Fig.4E, Supporting Information Table S8)。此外,RUNX2目标基因与血小板源性生长因子ββ(PDGF BB),Fas配体(FAS),α-联蛋白,以及转化生长因子β1(TGFβ1)信号通路有关(Fig.4E, Supporting Information Table S8)。有趣的是,我们发现命中的这些基因编码已知的RUNX2相互作用伴侣(protein interaction partners),包括ATF4,STAT1,以及FOS(Supporting Information Table S6, Supporting Information Fig.S9),提示这些蛋白质之间存在调控回路。
为了研究RUNX2结合的潜在功能性应用,我们检验了RUNX2目标基因的表达动态,以及RUNX2结合位点的组蛋白修饰动态。首先,我们发现第28天时372个上调的基因和339个下调的基因与RUNX2结合(Supporting Information Fig.S6A, Supporting Information Table S9),这意味着在我们的成骨模型中,所有分化性表达的基因中有30%左右在第28天时是与RUNX2结合的。这些基因中大部分之前没有被描述过是RUNX2的目标基因。IPA分析显示那些基因与增殖,迁移以及细胞死亡与发育的过程相关,上调的基因中相当一部分与骨骼发育和功能有关(Supporting Information Fig.S6B)。然后我们继续研究了把第28天和第0天对比,RUNX2与分化性表达基因相关的区域结合,是否也在组蛋白修饰状态上显示出变化;但是,只有不到1%的区域受到了影响(Supporting Information Fig.S6C)。这提示组蛋白修饰方面的改变并不是分化期间RUNX2与基因近端位点结合的主要调控因素,至少不是这次研究的这些修饰。最后,我们看过了所有RUNX2结合区域的组蛋白修饰状态,发现有100到200个区域受到H3K4m3,H3K9ac,或H3K27ac变化的影响,富集程度增加的区域比富集程度减少的区域更多(Supporting Information Fig.S6D)。几乎没有RUNX2结合位点受H3K27m3变化的影响。我们还发现RUNX2结合位点处的组蛋白修饰变化更多地出现在那些远端位点上(距基因起始处或结束处>2kb),而不是那些近端位点(距基因的5’端或3’端±2kb内)。总的来说,RUNX2似乎不会因为分化诱导的组蛋白富集程度变化而去结合到基因组位点上。Supporting Information Figure S7勾勒了识别RUNX2结合区域的实验工作流程。
从RUNX2峰值点的总列表中,我们识别出了97个与RUNX2结合有关的microRNA(miRNA)
miRBase注释序列(Supporting Information Table S5)。源自miRBase的序列代表着一种miRNA转录产物中预计的发夹部分,不包含原始转录产物的全长度信息。因此,对于这些基因我们无法确定RUNX2是结合在5’端还是3’端,正如对其它类型基因一样。但值得注意的是在注释的miRNA近端发现了很强的RUNX2富集,这些miRNA已知有骨生物学方面的作用,包括mir23a-27a-24-2蔟集,mir-22,mir-21,mir-143,mir-145,mir-221,以及mir-214[40~47](Supporting Information Fig.S8)。其它伴有RUNX2强烈富集的miRNA基因包括mir-4530,mir-3619,mir-let7a3以及let7b,mir-612以及mir199a1(Supporting Information Fig.S8)。
RUNX2与基因5’端和3’端结合的频率是差不多的,在基因内区域出现的频率高于基因间区域(Fig.4F)。所有RUNX2结合区域中差不多一半也有H3K27ac的富集,并且这些区域中大约三分之一也被H3K4m3结合(Fig.4G)。这提示RUNX2结合同时激活了启动子和增强子。只有一小部分仅与H3K4m3重叠。我们发现基因的5端大部分有H3K27ac(接近75%)及H3K4m3(50%)的富集,提示RUNX2启动子结合主要发生在转录活化基因处。在基因的3’端区域,与启动子处相比,较少与H3K27ac和H3K4m3重叠(Fig.4G)。COL1A1基因处RUNX2和组蛋白ChIP-Seq分布情况是上述类型的一个例子(Fig.4H)。在RUNX2的所有目标基因中,901个基因只有5’端结合,724个基因只有3’端结合,而541个基因既有5’端结合也有3’端结合(Fig.4I; Supporting Information Table S10A-S10C)。IPA分析显示,RUNX2结合在5’端还是3’端,结合位点不同,基因的细胞学功能也不同(Fig.4I)。5’端和3’端都有RUNX2结合的基因与细胞的运动和发育显著相关,就像ERK,PDGF BB,以及TGFB上游信号一样,而5’端结合RUNX2的基因与细胞间信号传递有关,3’端结合RUNX2的基因与细胞死亡和生存有关(Fig.4I,4J)。更多关于RUNX2在目标基因处的ChIP-Seq富集分布情况请见Supporting Information Fig.S9。
调控肿瘤形成的新TFs的识别
为了识别出涉及调控肿瘤形成分化的其它及潜在新转录因子(TFs),我们在启动子和增强子中做了TFBS富集分析,分析的是H3K4m3,H3K9ac及H3K27ac在第28天时相对于第0天时富集程度增加的情况,用的是Uniprobe,Jaspar,以及Transfac数据库。H3K4m3区域是唯一非常明确的有分化模体显著富集的区域的集合,所以我们把我们的分析集中到这种组蛋白标记物上。为了进一步缩小研究范围,我们找到了那些专门位于基因启动子上(离基因5’端±2kb)的模体,分化后这些启动子上H3K4m3的富集程度增加,而那些模体也上调了基因的表达,这是将第28天与第0天的RNA测序结果进行比对得出的(To further narrow down the search,we looked for motifs exclusively in promoters(±2kb from 5’gene end)of genes with increased H3K4m3 enrichment in their promoter after differentiation, and which also had upregulated gene expression, as determined by RNA-Seq, at Day 28 relative to Day 0)。用于识别新TFs的一个流程概括请见Supporting Information Figure S10。iMSC#3细胞中表达程度无法察觉的TFs的模体被排除在外,剩下的最显著的模体是属于TEA域家族成员2(TEAD2),PURA,GTF2I重复域内容1(GTF2IRD1),锌指蛋白148(ZNF148),以及通用转录因子Ⅱi的(GFT2I)(Fig.5A)。在这些模体中,TEAD2模体是最常出现的, 而在含有每种模体的启动子中都存在广泛的重叠,特别是TEAD2,GTF2IRD1以及PURA(Fig.5B)。为预测TEAD2目标基因而做的IPA分析显示它与细胞形态,发育(包括骨骼发育,数据未列出),生长,以及增殖,细胞运动及细胞死亡有关(Fig.5C)。为了研究每种TF在成骨过程中起的潜在调控作用,在iMSC#3细胞分化期间,用两段分开的小片段干扰RNAs(siRNAs)重复敲除掉每种TF的表达。对每种TF的这种siRNA处理重复了7~10次,在每次敲除72小时后用定量PCR测定了敲除效率(Supporting Information Fig.S11)。第28天时,细胞培养基用茜素红染色,成像,染色
也充当测定分化的手段。对GTF2I和TEAD2,与同样使用siRNA处理的对照组细胞相比,染色显著减少(Fig.5D,5E),强烈提示由于敲除,分化受到了特别的抑制。对GTF2IRD1和ZNF148,在其中一份经siRNA处理的细胞中观察到了染色显著减少的现象,但其它细胞中未发现(Supporting Information Fig.S12)。对PURA的敲除,我们没有观察到在矿化方面有任何显著的影响(Supporting Information Fig.S12)。
DISCUSSION
我们使用了不死化的非肿瘤生成性MSC细胞系,iMSC#3,以研究成骨分化期间基因调控变化。分化伴随着基因表达的变化,这些基因表达与分裂下降有关,同时那些设计成骨功能的基因表达上调,正如其他人观察到的那样(48,49),并且与“分化跟细胞周期进展停滞有关”的观念相吻合。另外,与细胞死亡和生存的基因上调了,这与之前观察到的成骨矿化中涉及的凋亡过程相一致(50)。此外,涉及细胞运动的基因上调,提示离体成骨过程中细胞迁移起一定的作用。第28天细胞中,这些基因的一部分与RUNX2结合(Supporting Information Fig.S6),支持了之前关于RUNX2是成骨分化过程中迁移调控因子的发现(19)。
基因表达的上调和下调分别与活化组蛋白修饰富集程度的增加和减少呈相关关系,正如其他人报导的那样(5,8)。不过,已经知道H3K27m3的动态变化发生在胚胎干细胞分化期间的启动子位置上(8,39),仅影响少数分化性表达的基因,因此似乎对MSCs向成骨方向分化的调控意义不大。但是,在很多表达程度没有发生可察觉变化的基因的启动子上,发现了广泛的表观遗传重塑。我们发现涉及神经形成的基因启动子处H3K27m3富集程度增加,提示MSCs的神经分化潜能在其向成骨方向分化时受到了限制。值得注意的是,已发现Zeste2增强子的抑制,即H3K27m3的转甲基酶反应,能增强MSCs向神经方向的分化(51)。反过来,在IPA分析中,启动子区域H3K27m3富集程度下降或H3K27ac富集程度增加的那些基因,跟肿瘤形成有强烈的关系,提示组蛋白修饰情况的改变与基因处发生的基因活化有关,这对它们在肿瘤发展过程中失调的观点提出了质疑。总体上来说,这些变化可以涉及到某种图式形成前机制中,这种机制在细胞执行下一阶段生长程序之前,控制着基因的活化或抑制。
此外,我们发现分化诱导基因组范围上的组蛋白H3K9和H3K27乙酰化水平降低。以前曾经描述过,在MSCs向成骨方向分化期间,基因启动子处H3K9ac富集程度总体上降低(52)。而且,在成肌,成脂,星形细胞以及少突细胞分化中也发现了组蛋白乙酰化水平降低(7,53,54)。合起来,这些发现提示在细胞分化中,启动子处以及远端调控元件处的去乙酰化可以是一种普遍现象,或许与染色质局部范围凝聚有关,这种凝聚使基因自由度变小,而基因的自由度跟转录和分化潜能是有关的。乙酰化减少的机制可能是组蛋白乙酰基转移酶和组蛋白脱乙酰基酶活性之间平衡的移动,或是潜在组蛋白分裂(potentially histone cleavage)(55)。
RUNX2表达的研究表明第28天时P1和P2启动子都有转录,提示这两种同工蛋白出现在分化细胞中。这两种同工体蛋白质之间只有N端19个氨基酸不同(56)。从突变小鼠中得到的证据提示,这两者中任意一种的使用起的作用更像是在整个发育期促进RUNX2表达的空间调节,而不是产生两种不同功能的蛋白质(57);但是,也有人报导了这两种蛋白质之间功能上的不同(56)。匪夷所思的是,分化过程伴有RUNX2转录物水平的强烈增高,而这在蛋白质水平上并没有反映出来,这些蛋白质与一种短转录产物的产生有相关关系,这种转录产物终止于P1启动子上游的一个新外显子处。这一短转录产物或许可以解释在其它研究中也观察到的(58),RUNX2mRNA与蛋白质水平之间的矛盾。在ENCODE中该转录产物被注释为编码蛋白质;但是尚不清楚其任何功能作用。尽管预测它是编码蛋白质的,在转录产物与蛋白质丰富程度有矛盾的观察基础上,有一点可以推敲的是这种转录产物有潜在的,
独立于翻译的功能,很有可能涉及到一种RNA介导的调控机制,这种调控机制可以影响到来自RUNX2位点或其它基因的转录产物。值得注意的是,我们也发现了骨肉瘤中这种短转录产物的表达(Lorenz et al.,数据未发表)。
已知RUNX2是一种成骨过程中增殖和分化的调控因子(16,17)。我们揭示了数百种与这一过程相关的RUNX2新目标基因(Supporting Information Table S7A);因此我们的数据强烈支持之前的发现,并帮助阐明了涉及执行成骨方向分化过程中这些方面的基因调控网络。RUNX2目标基因也与细胞形成组织有关,包括调控肌动蛋白细胞骨架,微管,以及局部黏附,还有迁移与凋亡(Supporting Information Table S7A),提示RUNX2涉及分化期间对这些过程的调控(19,59),可能也可以阐述RUNX2在癌症中,以及在特定代谢过程中失调造成的肿瘤生成作用(27)。
之前两项研究已经报导了癌症环境下,RUNX2结合位点在基因组范围上的分布情况。首先,对前列腺癌细胞系中过度表达且受到标记的RUNX2,做ChIP-Seq表明其主要结合在内含子区域及基因间区域,结合在基因启动子处的频率低,但是,它结合的启动子对应的目标基因跟分泌功能有关(60)。第二项研究识别出了SAOS-2骨肉瘤细胞系中2339个RUNX2目标基因,用的是ChIP和启动子微阵列,发现它主要结合在那些跟细胞黏附和运动性有关的基因上(61)。虽然用不同的实验流程和分析平台评估了RUNX2的结合位点,但比较这些数据,我们只发现了243个共同基因(Supporting Information Table S11)。总而言之,这可能指出了由于肿瘤背景环境所致的RUNX2结合特异性的转移,这涉及到对其正常目标基因调控的缺失。
新出现的证据表明p53和RUNX2之间有调控性相互作用。在来自p53无效(null)小鼠的骨祖细胞中,RUNX2表达增加(62),在U20S细胞中发现RUNX2蛋白水平受p53依赖性miRNA mir-34c作用而下调(30)。此外,人们发现RUNX2在BAX基因启动子处与p53相互作用,下调它的表达,并抑制由DNA损伤产生的细胞凋亡(29)。我们识别出了154个基因,它们直接或间接下调p53的目标基因,包括那些涉及凋亡和细胞周期调控的基因(Supporting Information Table S8),因此提示RUNX2在p53调控网络中有广泛的作用。
在我们的分析中,PDGF BB是另一个预测的RUNX2目标基因。PDGF BB是一种MSCs增殖与迁移的调控因子(63),有报导说它对成骨方向分化同时具有刺激和抑制作用(64,65)。就我们所知,没有报导文献将PDGF信号途径与RUNX2的功能联系起来。我们关于相当数量的RUNX2目标基因是已知的PDGF目标基因这一发现,提示RUNX2的调控可能与分化早期的增殖扩张有关。不过,已矿化的细胞中RUNX2结合到PDGF目标基因上这一点,提示它在分化晚期起作用。
令人惊讶的是,我们发现RUNX2频繁地结合在基因3’末端,或是紧靠其末端的下游,在许多例子中,其富集的范围非常广(Supporting Information Fig.S9)。RUNX2在5’端和3’端都富集的那些基因,跟细胞运动,发育,TGFB1以及PDGF BB信号途径强烈相关,只有5’端结合的基因与细胞间信号途径有关,只有3’端结合的基因与细胞死亡有关。这可能提示不同的上游调控途径影响RUNX2与目标基因的结合方式。此外,RUNX2在活化组蛋白标志物缺失的情况下更多地结合在3’端而不是5’端,提示3’端的结合发生在不同的背景环境下。以前的文献描述过其它TFs结合在基因3’末端或其附近,已经提示它在调控非编码RNAs反义转录成相应的蛋白编码基因方面起作用(66)。我们有初步的链特异性全RNA-Seq数据,提示在第28天iMSC#3细胞中,反义转录并没有广泛地跟RNA3’端结合相关(数据未列出)。令人费解的是,有些具有强烈3’端结合的基因,在其组蛋白富集区域非常近的地方有miRNA基因,因此RUNX2的结合与其说涉及到调控蛋白编码基因,不如说更像是涉及调控那些miRNA。但是这只是说少数基因是这样的。RUNX2在3’端结合的其它作用可能是调控转录终端,或是参与循环到启动子(involvement in looping to promoter),正如描述过的RNAPⅡ在
高表达基因中的作用那样(67)。尚需做更多的实验来确定RUNX2在基因3’端结合的生物学作用。
我们发现RUNX2蛋白水平相对较少受到分化的影响。因此,RUNX2的成骨作用更像是应该被解释为,它在诱导分化之前和之后结合在不同的基因组位点上。但是,通过研究RUNX2结合位点上潜在的分化诱导性组蛋白修饰变化,我们发现不存在这种相关性。因此,在我们的模型中,那些RUNX2结合发生的主要位点,第0天和第28天之间的组蛋白修饰情况没有发生变化。因此,RUNX2向染色质的定位,似乎不是由本研究中这几种组蛋白修饰的动态变化所驱动的。
基于有分化诱导组蛋白修饰变化的那些区域,我们预言5种其它的调控分化的TFs,通过基因敲除揭示出GTF2I和TEAD2对矿化有负性作用。编码GTF2I的基因位于7号染色体上某区域,该区域在Williams-Beuren综合征(WBS)中被删除掉,因此该基因被认为参与了该综合征(68)。WBS影响发育的几个方面,包括颅骨特征及身高,提示骨的发育受到了影响(68)。有报道称在小鼠C2C12成肌细胞中的成骨分化早期,敲除GTF2I增加了ALPL和BGLAP基因的表达(69)。与之相反,我们的发现提示敲除GTF2I对成骨分化有负性作用;不过,我们没有研究分化早期阶段基因的表达情况。此外,用的细胞类型不同,流程不同,可以解释这种不一致。TEAD2是Hippo信号途径中的一个影响因子,该信号途径通过平衡增殖与分化,在调控组织大小方面起关键作用(70)。TAZ,Hippo信号途径的一个介导因子,通过与RUNX2的相互作用来活化成骨基因,是间质分化中一个关键性的调节因子(71)。另外,TAZ在神经胶质瘤细胞中的过度表达,以一种TEAD依赖性方式,诱导了成骨方向分化(72)。就我们所致,还没有研究特别探索过正常骨分化中的TEAD2。我们的结果提示TEAD2的表达,对成骨分化的晚期阶段要实现矿化而言,是必要的。
CONCLUSION
总而言之,我们提供了成骨分化调控图景的新观点。我们描述了基因组范围上的染色质重塑,这种重塑相对于可以发现的基因表达程度变化而言,独立影响了发育基因和癌症相关基因。除此之外,我们提供了新的证据,以解释RUNX2是如何调控那些跟细胞增殖,分化及癌变相关的过程的,我们的办法是揭示出其在成骨细胞中的基因组结合位点,以及目标基因。最后,基于对那些组蛋白修饰状态改变区域中TFBS的预测,我们识别了两种转录因子TEAD2和GTF2I,并提供了其在成骨方向分化中调控作用的证据。
因篇幅问题不能全部显示,请点此查看更多更全内容