1. 引言
颅内动脉瘤(Intracranial Aneurysms, IAs)是颅内常见的脑血管病之一,它是发生在动脉壁上的异常凸起,既往的研究显示有3.6%~6%的人群患有IAs [1] [2]。颅内动脉瘤破裂是蛛网膜下腔出血(Subarachniod Hemorrhage, SAH)的常见原因,且预后往往较差 [3]。既往研究表明,年龄、高血压、饮酒等因素是颅内动脉瘤发生的高危因素,近年来又有关于血流动力学的研究发现血管内剪切力的改变也是颅内动脉瘤破裂的发病因素,但仍不能预测颅内动脉瘤发生破裂的风险 [4],而为了更进一步分析颅内动脉瘤破裂的危险因素,进行了解颅内动脉瘤形成和破裂的分子机制具有重要意义。人体基因组图谱所使用的高通量表达(Gene Expression Omnibus, GEO)在肿瘤中应用很多,但是该生物信息学分析方法在颅内动脉瘤中的应用较少,本文旨在试图挖掘潜在的核心基因。
2. 研究方法
2.1. 获取基因表达数据集
基因表达数据集是从GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)获得的。选择了IAs的三个基因表达数据集(GSE26969,GSE15629和GSE6551)。其中,GSE26969、GSE6551基于平台GPL570,芯片类型是Affymetrix Human Genome U133 Plus 2.0 Array表达谱芯片(Affymetrix,Santa Clara,CA);GSE15629基于平台GPL6244芯片类型是Affymetrix Human Gene 1.0 ST Arrayl.GSE15629数据集 [5] 包括8个破裂颅内动脉瘤和6个未破裂颅内动脉瘤。GSE26969数据集 [6] 包括3个未破裂颅内动脉瘤和3个正常血管壁,GSE6551数据集 [6] 包括8个破裂颅内动脉瘤、6个未破裂颅内动脉瘤和5个正常血管壁。
2.2. 获得差异基因
数据预处理:GEO数据库包括原始数据和预处理(背景校正,分位数标准化和探针总结)后的数据,本文下载了经过预处理的系列矩阵文件中的数据。然后,将探针级数据转换为基因表达值。不符合的探针组被删除。对于与一个基因相对应的多个探针,将平均表达值作为基因表达值。该过程使用R语言从Bioconductor (http://www.bioconductor.org/)下载的GSEquery和Limma软件包对数据进行处理。差异表达基因(Differentially Expressed Genes, DEGs)的筛选:实验组与对照组之间的DEG使用Bioconductor的limma包的t-检验鉴定,矩阵使用配对样本的方式构建。DEGs筛选标准:log2基因表达差异倍数(Fold Change, FC)绝对值 ≥ 1,adjust P < 0.05。
2.3. DEG的GO和KEGG途径分析
GO功能富集和通路分析:为了解每个共表达模块对应的生物学功能,使用在线分析工具DAVID (the Database for Annotation, Visualization and Integrated Discovery, https://David.ncifcrf.gov/)数据库 [7] 对DEGs行基因本体论(Gene Ontology, GO)和KEGG (Kyoto Encyclopedia of Genes and Genomes)信号通路分析,得到DEGs的生物学过程分析结果和KEGG信号通路分析结果,P < 0.05为差异有统计学意义。
2.4. PPI网络建设与模块分析
DEGs的PPI网络构建和关键基因筛选验证通过在线分析网站STRING (Search Tool for the Rtrieval of Interacting Genes, https://string-db.org/) [8] 得到DEGs的PPI网络,筛选条件为combined score > 0.4,之后进一步用Cytoscape筛选出PPI网络中处于关键位置的前10个基因,利用 Cytoscape [9] 的MCODE插件分析关键通路,条件参数设置为:Node Score Cutoff = 0.2,K-Core = 2,Max.Depth = 100,软件将自动生成核心Cluster。
3. 结果
3.1. 识别与IAs相关的DEG破裂
从GEO数据库中提取了IAs相关基因表达谱破裂的三个数据集(GSE26969,GSE15629和GSE6551)。 为了集成不同的实验和测序平台,需要对数据进行处理和标准化,见图1。最后,通过R软件包在GSE26969,GSE15629和GSE6551数据集中筛选了116个DEGs,其中60个基因表达上调,56个基因表达下调,热图可以清楚的显示这些基因的差异,见图2、图3,红色为上调基因。
3.2. DEGs的GO和KEGG分析
DEGs包括60个上调基因和56个下调基因,对其进行GO分析,结果显示其生物学过程(Biological Progress, BP)主要和血管内皮相关性结合受体相关性高,如细胞因子受体结合、细胞粘附分子结合、外源蛋白结合、模式识别受体等,见图4,气泡越红越大表示相关性越高。
3.3. PPI网络的建设与模块分析
使用STRING数据库构建了60个上调DGEs和56个下调DGEs的PPI网络,见图5。利用Cytoscape软件的Cytoscape,对以上DEGs进行关键的蛋白交互作用分析,结果显示,存在1个显著的蛋白交互网络,其KEGG通路富集分析列于表,血管内皮蛋白酪氨酸磷酸酶(VE-PTP, PTPRB)及相关的通路在颅内动脉瘤的发病过程中存在显著地相关性,见图6。

Figure 5. STRING protein interaction network diagram, red is up, blue is down
图5. STRING蛋白质相互作用网络图,红色为上调,蓝色为下调

Figure 6. PTPRB protein-protein interaction network
图6. PTPRB的蛋白–蛋白相互作用网络
4. 讨论
颅内动脉瘤的全球发病率约为3.2%,每年的发病率约为9.1人/10万人,大多数的颅内动脉瘤并不会破裂,但是一经破裂,则会造成SAH。在发生颅内动脉瘤破裂的蛛网膜下腔出血(aSAH)之后,有高达23%的患者将存在严重的后遗症,无论对个人生命安全,还是对家庭和社会,都会造成巨大的负担 [3]。
随着医疗水平的提高,患者对于生存质量有了更高的要求,健康查体的次数较往年有着明显的增加。在这个过程中就会检查出颅内动脉瘤,尽管有很多患者的动脉瘤并不会破裂,仅凭影像学并不能更好的辨别颅内动脉瘤是不是会破裂。血管内血流动力学的相关研究已经表明有些动脉瘤会不断的增大,会出现破裂的风险,但是其准确性仍有待提高。
吸烟、饮酒、高血压等危险因素已经证实可以导致颅内动脉瘤的发生,也是颅内动脉瘤破裂的危险因素。基因芯片技术已经应用于肿瘤很多年,但是在颅内动脉瘤方面仍较少应用。本次研究分析出116个DEGs,其中有60个上调基因和56个下调基因,我们通过生物信息学的方法,分析出血管内皮蛋白酪氨酸磷酸酶受体B型(VE-PTP, PTPRB)下调造成颅内血管内皮损伤的一个原因。
PTPRB编码的蛋白质属于蛋白质酪氨酸磷酸酶(PTP)家族,在血管内皮细胞中有特异性表达,在动脉和小动脉中尤为突出 [10]。由于胚胎和卵黄囊中多种与血管生成相关的缺陷,VE-PTP在小鼠中的消融导致妊娠10天时胚胎死亡。这些缺陷包括血管丛无法重构为大静脉和分支的血管网络,这表明对于血管生成过程(如血管的重构和维持)很重要 [11]。PTPs被认为是调控多种细胞过程的信号分子,包括细胞生长、分化、有丝分裂周期和致癌转化。该PTP包含一个胞外结构域、一个跨膜结构域和一个胞浆内催化结构域,因此属于受体型PTP [12]。
PTPRB对于调节内皮连接和血管发育至关重要,已有小鼠动物模型表明它能稳定视网膜血管。PTPRB的极化再分布促进了血管内皮细胞中Rac或Src的活化。VE-PTP与整合素合作通过上调c-Src活性来促进血管内皮细胞的扩散和迁移 [12],从而诱导了血管内皮细胞排列和伸长。 PTPRB还显示出通过介导VEGFR2的去磷酸化而使其失活,从而导致血管内皮细胞增殖的抑制以及血管内皮细胞极性和管腔形成的建立 [13]。此外,PTPRB被认为与VE-Ga黏着蛋白形成复合物,从而促进其黏附功能 [14] [15]。鉴于整联蛋白,VEGFR2和VE-Ga粘着蛋白是在血管内血流剪切力下诱导血管内皮细胞中反应的关键调节因子 [16] [17] PTPRB响应于血管内血流剪切力,相对于流向快速地重新分布到血管内皮细胞的下游边缘。PTPRB的这种积累可能有助于剪切力诱导的细胞形态变化。仍有相关研究认为血管内皮细胞可能是适应性的改变,但是我们综合了生物信息学分析和既往的研究表明,PTPRB下调仍然是颅内动脉瘤破裂的危险因素。
5. 结论
血管内皮蛋白酪氨酸磷酸酶(VE-PTP, PTPRB)及相关的通路在颅内动脉瘤的发病过程中存在显著相关性。PTPRB下调在颅内动脉瘤出现破裂具有较高的相关性,这为相关药物治疗并预防颅内动脉瘤破裂提供潜在的可选择靶点。
NOTES
*通讯作者。