学科分类
/ 1
20 个结果
  • 简介:摘要目的构建基于免疫基因的胃癌预后评估模型。方法从癌症基因组图谱数据库下载胃癌测序、临床数据并整理。将胃癌样本分为训练集(221例)、验证集(147例),在训练集中依次采用单因素、多因素Cox分析,构建免疫基因预后评估模型,并在验证集中验证。采用单样本富集分析将测序数据转化成28种免疫细胞比例的数据,分析高、低风险组与免疫细胞浸润的相关性。筛选高、低风险组差异基因并进行富集分析。结果由9个免疫基因(PROC、IGKV1D-43、CLCF1、TAFA4、NOX4、INHA、ITGAV、FABP3、IL27RA)构建的风险评估模型,是影响胃癌预后的独立危险因素。训练集、验证集Kaplan-Meier生存曲线显示,对比低风险组,高风险组5年总生存率显著降低[50.5%(55/111)比20.0%(22/110),43.2%(32/74)比24.7%(18/73),均P<0.05];训练集受试者工作特征曲线(ROC)第1、3、5年曲线下面积(AUC)值分别为0.69、0.71、0.78,验证集ROC第1、3、5年AUC值分别为0.56、0.71、0.78。另外,高风险组浸润的活化CD4+ T细胞的比例显著降低(P<0.05)。高、低风险组差异基因主要富集于PI3K-AKT等通路。结论基于生物信息学方法构建的胃癌预后评估模型可成为胃癌预后判断的新指标。

  • 标签: 癌症基因组谱图 胃癌 差异表达基因 Cox比例风险回归模型 预后
  • 简介:目前为止世界上最大的癌症基因信息数据库。该数据库借助于大规模测序为主的基因组分析技术,将目前人类几乎所有癌症的基因组变异与基因表达水平图谱进行绘制,这将为发现肿瘤基因组的改变以及研究其生物学分子机制提供海量的数据。目前,该数据库向科研人员免费开放,提供进行肿瘤相关研究的数据。本文的主旨是对TCGA公开数据的提取方法进行分析,从而对肿瘤学相关科研人员提供帮助。

  • 标签: TCGA数据库 肿瘤 数据提取
  • 简介:摘要:目的:分析基于TCGA数据库。方法:访问TCGA并下载与患者结肠癌相关的数据集,并获得RPE-108k3BGBD基因表达谱以及相关临床信息。分析在结肠癌中RPE-108k3BGBD基因表达情况,分析表达与临床病理学参数相关性以及对患者预后的影响。采用GO信息和KEGG通路信息进行富集分析RPE-108k3BGBD基因在结肠癌中的调控通路。结果:根据TCGA数据集可以发现,在结肠癌肿瘤中RPE-108k3BGBD基因为低表达,根据COX多因素分析表明影响结肠癌预后的独立因素包括T分期,M分析,以及RPE-108k3BGBD基因表达。RPE-108k3BGBD基因低表达样品富集到DNA复制以及细胞周期等基因集。结论:通过TCGA数据库预测结肠癌患者的临床病理学研究具有明显的价值,在可以为患者的预后生存时间进行全方面的评估,得出较为有效的结果。

  • 标签: TCGA数据库 临床病理学 结肠癌
  • 简介:摘要目的基于TCGA数据库挖掘出肾上腺皮质腺癌(ACC)发病相关的关键基因,为以后ACC相关的基础以及临床研究提供重要参考依据。方法从TCGA数据库获取150例ACC样本和3例癌旁正常组织样本,利用R语言软件进行差异表达分析,利用DAVID在线工具进行GO和KEGG PATHWAY功能富集分析,最后应用STRING在线检索工具及Cytoscape软件构建蛋白质-蛋白质相互作用(PPI)网络并筛选出前10位的hub基因。结果从TCGA数据库共挖掘出1 744个差异表达基因,包括1 199个表达上调基因和545个表达下调基因,对其进行GO和KEGG PATHWAY功能富集分析以及功能注释,获取关键通路信息:差异表达基因(DEGs)主要富集于细胞黏附、膜的组成成分、网格蛋白结合及神经活性配体-受体相互作用,最后构建PPI网络并筛选得到GNG2、GNG3、GNG4、GNG8、GNB3、BDKRB1、MCHR1、SAA1、ADCY2、LPAR3这10个关键基因。结论本研究发现10个与ACC发生发展相关的关键基因,这10个关键基因与多种肿瘤的增殖与转移密切相关,有望成为ACC早期诊断、靶向治疗及预测预后的新型生物标志物。

  • 标签: 肾上腺肿瘤 TCGA数据库 基因
  • 简介:摘要目的筛选与结肠癌预后相关长链非编码RNA(lncRNA),并构建结肠癌预后风险模型。方法数据提取时间:建库至2022年3月1日。从癌症基因组图谱(TCGA)数据库下载并整理结肠癌转录组数据,构建配对样本lncRNA表达矩阵,利用“edgeR”R包筛选获得差异表达lncRNA(DElncRNA)。对DElncRNA先后行COX回归模型单变量分析、Lasso回归分析、Kaplan-Meier(K-M)生存分析、多元COX回归模型分析,获取预后相关lncRNA。依据多元COX回归模型中回归系数构建结肠癌预后风险模型。通过C指数值、时间依赖的受试者工作特征曲线(ROC)和ROC下的面积(AUC)及K-M生存分析评估模型预测的准确性。对模型中lncRNA构建竞争性内源RNA(ceRNA)网络,对相关的mRNA进行基因本体论(GO)、京都基因与基因组大百科全书数据库(KEGG)富集分析,探索lncRNA影响结肠癌进展的机制。结果整理转录组数据得到5 460个lncRNA,配对样本分析获得DElncRNA 868个,其中上调548个、下调320个。单变量COX回归分析后获得40个lncRNA,经Lasso回归分析过滤共线性因素,得到lncRNA 34个,K-M生存分析后,得出14个候选lncRNA。再进行多元COX回归分析,得到7个预后相关lncRNA(下调:LINC01132;上调:ELFN1-AS1、RP5-884M6.1、LINC00461、RP1-79C4.4、RP4-816N1.7、RP3-380B8.4),依据回归系数构建预后风险模型。模型的C指数值为0.82;3年和5年的AUC值分别为0.79、0.84;进行K-M生存分析提示高低风险组生存率差异有统计学意义(P<0.000 1)。随后构建ceRNA网络,通过KEGG富集分析提示下调lncRNA可能是通过肌动蛋白细胞骨架的调控、癌症中蛋白聚糖、PI3K-Akt信号通路等抑制结肠癌进展,上调lncRNA可能是通过细胞粘附分子、局灶性粘连、吞噬体等通路促进结肠癌进展。结论本研究构建了一个包含7个lncRNA的结肠癌预后风险模型,具有较好预测患者生存预后准确性,每个lncRNA是潜在单独的预后生物标志物,对临床上结肠癌患者预后评估具有一定参考价值。

  • 标签: 结肠癌 结直肠癌 TCGA lncRNA 预后模型
  • 简介:摘要目的利用癌症基因组图谱(TCGA)中的大量胃癌基因组数据,在胃癌组织差异表达的基因中挖掘与预后相关的基因。方法在TCGA数据库中下载胃腺癌相关基因芯片数据,经R语言数据预处理及用edgeR对基因表达数据进行差异表达分析,利用R语言对差异基因进行基因本体论(GO)富集及KEGG生物通路分析。多因素逐步回归Cox分析预测影响生存期的基因,利用Kaplan-Meier Plotter(http://Kaplan-Meier Plotter.com)网站对上述得到的基因进行在线生存分析。结果TCGA数据库中共筛选胃癌标本305个,癌旁组织30个。得到3 231个胃癌差异基因,其中上调2 005个基因,下调1 226个基因。GO富集主要集中于抗原连接、丝氨酸水解酶活性、受体配体活性、丝氨酸型肽酶活性、丝氨酸型内肽酶活性、糖胺聚糖结合、细胞因子活性、激素活性、肽酶抑制剂活性、金属钛酶活性等分子功能。KEGG生物通路分析主要涉及化学致癌物、神经活性受体-配体相互作用、细胞因子-细胞因子受体相互作用、细胞色素P450对有害物质的代谢、蛋白质的消化与吸收、金黄色葡萄球菌感染、视黄醇代谢、药物代谢P450、类固醇激素生物代谢、胰液分泌等。Cox分析显示,基因GPX3和SERPINE1对胃癌患者生存期有显著影响。受试者工作特征曲线分析显示,GPX3和SERPINE1表达量的高低对胃癌患者生存期有一定的预测价值,二者临界值分别为0.46、0.68时,敏感性为60.35%,特异性为82.06%,曲线下面积为0.763(95%CI为0.828~0.936)。Kaplan-Meier分析发现,GPX3(P<0.001)和SERPINE1基因(P=0.001)高表达与胃腺癌不良预后有明显关系。结论SERPINE1、GPX3基因表达越高,胃癌患者生存期越短,二者可能作为胃癌预测预后的靶点。

  • 标签: 胃肿瘤 原癌基因 预后 基因本体
  • 简介:摘要:目的 探讨原发性胃癌的中医辩证分型与原发性胃癌的癌症基因组图谱( TCGA)分型相关性。方法 选取江苏省中医院 2014-2018年胃癌病例 76例,均经病理学检查证实为原发性胃癌,用 SPSS软件分别分析中医证型与 TCGA分型之间的相关性。结果 中医证型与 TCGA分型之间无显著相关。结论 对原发性胃癌中医分型与 TCGA分型基础上,可有针对性联合中西医用药,以提高疗效。

  • 标签: 原发性胃癌 中医证型 TCGA分型
  • 简介:摘要 目的:通过分析 GEO数据库中食管癌的芯片数据集,挖掘差异表达基因,并在 TCGA数据库中验证,寻找食管癌的候选肿瘤标志物。方法:分析 GEO数据库中食管癌的三个芯片数据集 GSE17351、 GSE75241、 GSE89102,分别搜索差异表达基因,利用韦恩软件寻找核心基因。在 TCGA数据库中验证核心基因,并且进行 GO功能注释和 KEGG代谢通路分析。最后对通过验证的核心基因进行生存分析。结果: GSE17351芯片数据集筛选出 618个差异表达基因,其中下调基因 265个,上调基因 353个; GSE75241芯片数据集筛选出 1652个差异表达基因,其中下调基因 481个,上调基因 1171个; GSE89102芯片数据集筛选出 7939个差异表达基因,其中下调基因 312个,上调基因 7627个。利用韦恩软件,发现核心基因 115个,上调基因 94个,下调基因 94个。在 TCGA数据库中进行了验证、 GO功能注释和 KEGG代谢通路分析。对通过验证的核心基因进行生存分析,发现 CDKN3、 NUP155、 RAD51AP1可以作为食管癌的候选肿瘤标志物。

  • 标签: 食管癌 GEO TCGA 肿瘤标志物
  • 简介:

  • 标签:
  • 简介:摘要目的通过对癌症基因组图片(TCGA)数据库中转录组数据进行分析,筛选与膀胱尿路上皮癌相关的预后分子标签。方法提取TCGA数据库中膀胱尿路上皮癌患者的临床数据以及膀胱尿路上皮癌和癌旁组织中的转录组数据,采用LASSO-Cox回归分析筛选膀胱尿路上皮癌预后相关的mRNA,并构建膀胱尿路上皮癌的预后分子标签。结果首先筛选出膀胱尿路上皮癌和膀胱正常组织中差异表达基因8738个,经过单因素Cox分析得到2824个与膀胱尿路上皮癌预后相关的基因(P<0.05),选取P<0.0001的mRNA 225个,进一步采用LASSO-Cox回归分析筛选出11个与膀胱尿路上皮癌预后相关的基因,分别为TPST1、ANXA1、LINC01138、AMIGO2、HOOK1、AC005730.2、KANK4、PEX5L、AL353572.1、CATSPER4、AL645939.1,最后联合这11个基因构建出膀胱尿路上皮癌的预后分子标签。利用分子标签基因构建的模型能将膀胱尿路上皮癌划分为高表达组和低表达组,绘制分子标签生存曲线及受试者工作特征(ROC)曲线,结果显示:分子标签表达水平与膀胱尿路上皮癌患者的预后有显著性关联,分子标签值越高,患者预后越差。结论通过对TCGA数据库的分析,发现TPST1、ANXA1、LINC01138、AMIGO2、HOOK1、AC005730.2、KANK4、PEX5L、AL353572.1、CATSPER4、AL645939.1和AL645939.1对膀胱尿路上皮癌的预后有影响,且构建的分子标签表达水平与膀胱尿路上皮癌的预后有显著性关联。

  • 标签: 膀胱肿瘤 生物标记 TCGA数据库
  • 简介:摘要目的研究乳腺癌中差异表达免疫相关基因与肿瘤预后的关系,寻找潜在的免疫治疗靶点。方法从TCGA数据库中下载乳腺癌转录组和患者对应的临床数据,利用生物信息学方法,筛选出在癌组织中的差异表达基因,同时结合ImmPort数据库,筛选出与患者总生存期密切相关的免疫基因,COX回归构建用于预后评估的风险评分模型并评价其预测能力。结果在乳腺癌与癌旁组织中共发现2499个差异表达基因,进一步筛选出差异表达的免疫相关基因138个,单因素COX分析显示9个免疫基因呈现与预后相关,多因素COX分析筛选出6个免疫相关基因作为预后的独立危险因素用于构建风险评分模型。临床特征COX回归分析显示患者风险值为独立预后因素(P<0.05)。结论乳腺癌中存在多个差异表达的免疫基因,这些基因与患者预后密切相关,基于这些免疫基因构建的风险评分模型可有效预测患者预后,为乳腺癌的免疫治疗提供新的潜在治疗靶点。

  • 标签: 乳腺癌 TCGA 免疫基因 预后
  • 简介:摘要目的探讨癌症基因组图谱(TCGA)分子分型在子宫内膜癌(EC)中的应用及其临床意义。方法收集2018年12月至2021年3月于北京大学人民医院行手术治疗且采用高通量测序技术进行TCGA分子分型的EC患者共66例,EC的TCGA分子分型分为4种,DNA聚合酶ε(POLE)超突变型、高度微卫星不稳定性(MSI-H)型、低拷贝型、高拷贝型。回顾性分析4种TCGA分子分型患者的临床病理特征、免疫相关分子学特征以及预后情况。结果(1)临床病理特征:66例EC患者的中位年龄为56岁(范围:24~78岁)。其中,POLE超突变型3例(5%),MSI-H型11例(17%,其中Lynch综合征2例),低拷贝型42例(64%),高拷贝型10例(15%)。4种TCGA分子分型患者的合并其他器官恶性肿瘤情况、肿瘤家族史、手术方式、分期、肌层浸润深度、淋巴脉管间隙浸润(LVSI)、病理类型分别比较,差异均有统计学意义(P<0.05),其中高拷贝型患者晚期(Ⅲ~Ⅳ期)、深肌层浸润、LVSI阳性所占比例显著升高;而4种TCGA分子分型患者的年龄、绝经状态、体质指数、代谢综合征相关合并症、术前血清CA125及人附睾蛋白4水平、肿瘤最大径、病理分级(仅指子宫内膜样癌)、淋巴结转移情况分别比较,差异均无统计学意义(P>0.05)。(2)免疫相关分子学特征:66例EC患者中,27例患者行细胞程序性死亡配体1(PD-L1)蛋白免疫组化法检测,28例患者行肿瘤突变负荷(TMB)检测,POLE超突变型及MSI-H型患者的PD-L1阳性表达率、TMB高表达率均显著高于低拷贝型、高拷贝型患者(P<0.05)。(3)预后分析:66例EC患者的中位随访时间为10个月(范围:0~28个月),随访期内死亡2例(低拷贝型1例、高拷贝型1例),盆腔复发和远处转移3例(低拷贝型1例、高拷贝型2例)。POLE超突变型、MSI-H型、低拷贝型、高拷贝型患者的无进展生存率(PFS)分别为100%、100%、98%、80%,4者比较,差异有统计学意义(P=0.034);总生存率(OS)分别为100%、100%、98%、90%,4者比较,差异无统计学意义(P=0.361)。其中,POLE突变型、MSI-H型患者的PFS、OS较高,高拷贝型患者最低。结论EC的TCGA分子分型在临床应用中具有可行性及应用价值,对于EC患者的预后有一定的预测作用,可为患者的个体化诊断和治疗提供新策略。

  • 标签: 子宫内膜肿瘤 生物标记,肿瘤 高通量核苷酸序列分析 DNA聚合酶Ⅱ 微卫星不稳定性 DNA拷贝数变异 突变 预后
  • 简介:摘要目的探讨胰腺癌相关糖尿病(PCDM)的基因特征,筛选潜在的分子标志物。方法收集来自癌症基因组图谱(TCGA)-胰腺癌(PC)数据集的临床数据,根据PC确诊前2年内是否诊断糖尿病,将患者分为PCDM组(11例)和PC组(109例)。提取TCGA-PC数据集mRNA的芯片表达谱数据,通过R软件"limma"程序包进行两组基因差异表达分析,以"|log2(fold change)|>2且P<0.05"为条件筛选差异基因(DEGs),并进行基因本体(GO)和京都基因与基因组百科全书(KEGG)通路富集分析,最后通过STRING数据库构建蛋白相互作用(PPI)网络,通过Cytoscape软件MCODE模块筛选枢纽基因。结果TCGA-PC数据集mRNA基因差异分析显示,20 531个基因中47个在PCDM组高表达,60个低表达。GO分析显示107个DEGs在生物学功能方面主要参与正向调节细胞分泌功能(基因数=9,P<0.01),在分子功能方面主要集中于受体功能调节(基因数=10,P<0.01),在细胞组分方面主要与细胞质微管腔内成分相关(基因数=8,P<0.01)。KEGG通路富集分析显示,107个DEGs可能通过细胞因子相互作用(基因数=8,P<0.01)影响PCDM。PPI网络分析显示,GNG8、CNR2、GALR2、CXCL13、NPY2R可能是PCDM相关的枢纽基因。结论PCDM与PC在细胞分泌功能、受体功能、细胞质微管成分及细胞因子相互作用方面存在基因差异。GNG8、CNR2、GALR2、CXCL13、NPY2R可能成为PCDM的潜在分子标志物。

  • 标签: 胰腺肿瘤 糖尿病 胰腺癌相关糖尿病 癌症基因组图谱
  • 简介:摘要肿瘤基因组图谱(The Cancer Genome Atlas,TCGA)涵盖了多种癌症组学数据,包括转录组数据、表观遗传组学数据、基因突变数据和疾病样本临床数据等,是肿瘤研究中不可或缺的工具。文章介绍近年来围绕TCGA数据库进行的消化系统、呼吸系统部分肿瘤学研究成果,期望利用数据库资源为相关科研人员提供肿瘤基因组学研究的新思路。

  • 标签: 肿瘤基因组图谱 基因突变 表观遗传组学
  • 简介:摘要目的探讨N6-甲基腺嘌呤(m6A)在结直肠癌组织中表达及临床意义。方法2021年9月至2021年12月,利用癌症基因组图谱(TCGA)和基因表达综合数据库(GEO)对结直肠癌中m6A相关调控因子的表达进行汇总分析,对不同临床病理特征及分子分型下m6A调控因子的基因表达进行对比统计,对不同表达m6A的结直肠癌病例做生存分析。结果在TCGA数据库中,胰岛素样生长因子2 mRNA绑定蛋白1(IGF2BP1),胰岛素样生长因子2 mRNA绑定蛋白3(IGF2BP3)和YTH结构域m6A RNA结合蛋白1(YTHDF1)在结直肠癌组织中较正常组织高表达(TCGA-COAD比IGF2BP3:12.80比204.46,logFC=4.00,P=0.003;YTHDF1:2 347.56比3 712.77,logFC=0.66,P < 0.001;TCGA-READ比IGF2BP1:6.20比359.32,logFC=5.82,P=0.007;YTHDF1:2 470.10比4 369.09,logFC=0.82,P=0.020);将TCGA和GEO数据库做交集后,发现甲基转移酶样14(METTL14)、YTH结构域m6A RNA结合蛋白3(YTHDF3)和α-酮戊二酸依赖的加双氧酶AlkB同源蛋白5(ALKBH5)均在结直肠癌组织中下调(TCGA-COAD比METTL14:1 051.56比711.40,logFC=-0.56,P < 0.001;YTHDF3:4 613.85比3 155.05,logFC=-0.55,P < 0.001;ALKBH5:4 250.10比2 555.55,logFC=-0.73,P < 0.001;TCGA-READ比METTL14:1 113.3比674.36,logFC=-0.72,P < 0.001;YTHDF3:5 034.30比3 331.95,logFC=-0.60,P=0.004;ALKBH5:4 902.20比2 529.71,logFC=-0.95,P < 0.001;GEO-CRC比METTL14:6.58比6.33,logFC=-0.06,P < 0.001;YTHDF3:6.28比6.20,logFC=-0.02,P=0.002;ALKBH5:5.07比4.98,logFC=-0.02,P < 0.001)。在不同分子分型结直肠癌中IGF2BP2、HNRNPC、TP53和YTHDF2在KRAS突变中低表达(IGF2BP2:48.53比44.04,t=2.64,P=0.008;HNRNPC:121.30比112.60,t=2.32,P=0.020;TP53:65.30比60.26,t=2.11,P=0.034;YTHDF2:54.07比51.19;t=1.97,P=0.048)。不同临床病理特征分析显示,IGF2BP1在淋巴结阳性(8.97比6.11,W=20 008,P=0.002)、存在远处转移(8.94比6.41,W=19 104,P=0.009)及Ⅲ~Ⅳ期(7.46比7.13,W=8 779,P=0.025)的结直肠癌中较对照组升高。ALKBH5高表达、高龄、存在脉管侵犯和病理分期晚与较短生存期显著相关(ALKBH5高表达比ALKBH5低表达:5.85年比NA,HR:1.63,95%CI:1.071~2.491,P=0.021。> 68岁比 < 68岁:6.78年比NA,HR:1.59,95%CI:1.049~2.422,P=0.047。Ⅲ~Ⅳ期比Ⅰ~Ⅱ期:4.55年比8.33年,HR:2.89,95%CI:1.895~4.425,P < 0.001。有静脉侵犯比无静脉侵犯:5.48年比NA,HR:2.82,95%CI:1.672~4.783,P < 0.001)与生存时间短具有明显相关性。结论m6A中的部分调控因子与结直肠癌的生物学特征及预后相关。

  • 标签: 结直肠肿瘤 n6-呋喃甲基腺嘌呤 蛋白甲基转移酶类 癌症基因组图谱 基因表达综合数据库
  • 简介:摘要目的研究结肠肿瘤中高迁移率族蛋白B1基因(HMGB1)的差异表达及预后价值。方法从Oncomine及TCGA数据集中筛选出2 191例结肠肿瘤患者HMGB1基因表达数据及临床病理数据,采用Mann-Whitney U检验比较结肠癌与腺瘤、左半结肠癌与右半结肠癌、原位癌与浸润癌、黏液性腺癌与其他病理类型结肠癌、以及发生淋巴结转移与无淋巴结转移、发生远处转移与无远处转移结肠癌组织中HMGB1基因差异表达情况,并绘制Kaplan-Meier生存曲线。结果HMGB1基因在结肠癌组织和腺瘤组织中均较正常结肠组织高表达(P<0.001),在结肠癌组织中较结肠腺瘤组织中高表达,在左半结肠癌组织中较右半结肠癌高表达(P<0.05),在黏液性腺癌组织中较其他病理类型低表达(P<0.05),在浸润癌组织中较原位癌高表达(P<0.001)。有淋巴结转移及远处转移者较未转移者高表达(P<0.05)。HMGB1基因高表达提示更高的5年生存率(P=0.011),尤其对于女性结肠癌患者(P=0.006)。结论HMGB1基因可作为判断结肠癌浸润深度、淋巴转移、远处转移及预后的标志物。

  • 标签: 结肠肿瘤 HMGB1 Oncomine TCGA 生存分析
  • 简介:摘要目的探讨子宫内膜癌(EC)患者预后相关差异基因筛选,并构建其预后预测模型。方法在癌症基因组图谱(TCGA)数据库(https://portal.gdc.cancer.gov/)中,以"Uteri" "TCGA-UCEC" "transcriptome profiling" "gene expression quantification and HTSeq-FPKM"为关键词,检索EC患者和正常女性受试者的子宫内膜组织RNA-seq微阵列基因表达数据及其相关临床信息。本研究检索时间设定为TCGA数据库建库至2021年1月15日。选择最终符合本研究纳入标准的542例EC患者与35例正常女性受试者为研究对象。本研究基于TCGA数据库的EC差异基因患者的预后预测模型构建步骤为:①利用R语言微阵列数据的线性模型(LIMMA)包,对TCGA数据库的RNA-seq微阵列基因表达数据进行差异基因分析,筛选影响EC发生、发展的候选差异基因。②利用Kaplan-Meier法、LASSO算法回归、单因素Cox比例风险回归分析法,对EC患者生存相关差异基因进行筛选。采用多因素Cox比例风险回归分析法,确定EC患者预后相关差异基因。③构建EC差异基因的EC患者预后预测模型。④利用survival受试者工作特征(ROC)曲线软件包,检测该预测模型的准确性,并绘制列线图。结果①在本组EC患者中,共计发现466个EC差异基因,其中上调基因为179个,下调基因为287个。②在本组EC患者的96个EC生存相关差异基因中,7个为预后相关差异基因,包括孕激素受体(PGR)、sushi重复含蛋白质X连锁(SRPX)、γ-谷氨酰水解酶(GGH)、分泌球蛋白家族2A成员1(SCGB2A1)、胰岛素样生长因子结合蛋白5(IGFBP5)、细胞周期蛋白依赖性激酶抑制剂2A(CDKN2A)、神经调节素U(NMU)基因。对这7个差异基因的单因素Cox比例风险回归分析结果显示,其均为EC患者预后影响因素(P<0.05)。多因素Cox比例风险回归分析结果显示,GGH、IGFBP5、CDKN2A差异基因,均为影响EC患者预后的独立危险因素(P<0.05),若EC患者GGH、IGFBP5、CDKN2A差异基因表达水平越高,则患者预后越差。③建立EC患者总体生存(OS)期预测模型为:ln[h(t,X)/h0(t)]=1.300xGGH+1.200xIGFBP5+1.200xCDKN2A。其中,h(t,X):受试者在t时刻的风险率函数,h0(t):受试者在t时刻的基准风险率函数,即xGGH、xIGFBP5、xCDKN2A均为0时的风险率函数,xGGH、xIGFBP5、xCDKN2A分别表示GGH、IGFBP5、CDKN2A差异基因表达水平。④采用上述预测模型,对研究组患者的生存风险进行评分,并按照其中位风险评分,进一步将其分为高危亚组(n=271,风险评分高于中位评分)与低危亚组(n=271,风险评分低于中位评分),并且低危亚组OS期显著长于高危亚组,差异有统计学意义(χ2=33.000,P<0.001),对该模型预测EC患者OS期的ROC曲线分析结果显示,曲线下面积(AUC)为0.700(95%CI:0.673~0.751,P<0.001),同时构建的Nomogram列线图,可定量预测EC患者1、3、5年OS率。结论构建的GGH、IGFBP5和CDKN2A差异基因的EC患者预后预测模型,可为临床预测EC患者预后及寻找相应靶向治疗药物提供数据支持。

  • 标签: 子宫内膜肿瘤 TCGA数据库 生物学标记 预后 女(雌)性
  • 简介:摘要目的通过挖掘美国癌症基因图谱计划(TCGA)和中国脑胶质瘤基因图谱计划(CGGA)中胶质瘤基因谱数据库,分析KIF15在胶质瘤中的表达及临床意义。方法通过人类蛋白数据库探究KIF15在神经系统中的表达特征。获取TCGA和CGGA中胶质瘤患者肿瘤样本全基因转录组(mRNAseq)数据,分析KIF15在不同级别和病理类型胶质瘤中的转录水平差异,及其与患者中位生存期的关系。通过胶质瘤标本芯片进行KIF15的免疫组织化学染色,分析KIF15在胶质瘤不同级别中的蛋白水平差异,通过转录组数据分析KIF15与肿瘤增殖指标Ki67的相关性,并通过差异基因(DEGs)进行基因本体(GO)分析和信号通路富集(KEGG)分析探讨KIF15在胶质瘤中参与调控的分子信号通路。结果在中枢神经系统大脑中,各部位组织可检测到KIF15的蛋白水平和转录水平均较低。TCGA和CGGA转录组数据分析显示,胶质瘤WHO级别越高,KIF15的mRNA水平显著增高,WHO Ⅳ级相较于WHO Ⅱ级和Ⅲ级,差异有统计学意义(P<0.05);并且,在胶质母细胞瘤中KIF15的mRNA水平最高,相比较于星形胶质细胞、少突胶质细胞瘤、少突星形胶质细胞瘤、间变性星形胶质细胞瘤、间变性少突胶质细胞瘤,差异均有统计学意义(P<0.05)。KIF15高水平组患者的中位生存期较KIF15低水平组更短,差异有统计学意义(P<0.05)。胶质瘤组织芯片染色结果显示,WHO级别越高,胶质瘤组织染色强度评分趋向更高,WHO Ⅳ级胶质瘤评分以2、3分为主,而WHO Ⅱ级以0、1分为主。KIF15和Ki67的mRNA水平之间为显著性正相关关系,在TCGA转录组数据和CGGA转录组数据库中r值分别为0.725、0.706。TCGA转录组数据共筛选到707个DEGs,KIF15高水平组相比较于KIF15低水平组,表达水平升高的DEGs有328个,表达水平降低的DEGs有379个。GO分析显示这些DEGs参与的生物学过程前10位包括有细胞周期转换和细胞有丝分裂调控。分子信号通路KEGG分析显示DEGs参与的分子信号通路包括细胞周期、P53通路和DNA复制。结论KIF15在胶质瘤中高表达,并且高水平KIF15预示胶质瘤恶性程度高,患者生存期较差。KIF15参与调控了肿瘤细胞周期通路,可能是一个潜在的胶质瘤基因治疗靶点。

  • 标签: 胶质瘤 KIF15 美国癌症数据库 中国脑胶质瘤数据库
  • 作者: 向晓辉 毛骏 李海
  • 学科: 医药卫生 >
  • 创建时间:2020-08-10
  • 出处:《中华胰腺病杂志》 2020年第03期
  • 机构:天津市西青医院消化内科,天津 300380;天津市肝脏胰腺纤维化与分子诊疗重点实验室,天津 300162,武警后勤学院研究生队,天津 300309;天津市肝脏胰腺纤维化与分子诊疗重点实验室,天津 300162
  • 简介:摘要目的探讨着丝粒蛋白A(CENP-A)基因在胰腺癌中的表达、临床意义及其在胰腺癌发生发展中的作用。方法分别从高通量基因表达(GEO)数据库的1个包含45例胰腺癌患者微阵列数据集(GSE28735)和癌症基因组图谱(TCGA)数据库的1个包含177例胰腺癌患者数据集获得CENP-A mRNA表达谱和临床病理资料。采用生物信息学方法分析CENP-A在胰腺癌组织表达与临床病理指标的相关性以及对患者预后的影响。采用基因集富集分析(GESA)预测CENP-A在胰腺癌发生发展中调控的可能通路,同时结合STRING数据库中CENP-A蛋白质-蛋白质相关作用网络(PPI)筛选出与CENP-A相关的蛋白,并分析两者表达的相关性。结果胰腺癌组织CENP-A mRNA的表达量显著高于癌旁组织,差异有统计学意义(4.492±0.361比3.431±0.405,P=0.001)。胰腺癌组织CENP-A表达水平与肿瘤TNM分期和分级显著相关(P<0.05)。CENP-A高表达患者总体生存期显著低于CENP-A低表达患者(P<0.05)。CENP-A高表达的胰腺癌组织存在细胞周期和DNA复制两条通路基因集的富集(P<0.01,错误发现率<0.05)。通过PPI网络分析发现胰腺癌组织CENP-A与周期蛋白依赖性激酶1(CDK1)、纺锤体检测蛋白1(BUB1)呈显著相关(r值分别为0.861、0.825,P值均<0.001)。结论胰腺癌组织CENP-A基因高表达与其恶性生物学行为有关,其机制可能是通过与CDK1、BUB1的协同作用实现。

  • 标签: 胰腺肿瘤 计算生物学 着丝粒蛋白质 生物学标记
  • 简介:摘要目的研究促性腺激素释放激素(gonadotropin-releasing hormone,GnRH)及其受体(gonadotropin-releasing hormone receptor,GnRHR)在乳腺癌中的表达情况,探索其临床意义。方法从美国癌症基因组图谱(The Cancer Genomes Atlas,TCGA)数据库下载乳腺癌患者GnRH、GnRHR基因表达数据和临床病理信息资料,分析GnRH、GnRHR与乳腺癌临床病理学指标和预后的相关性。结果乳腺癌组织中GnRH表达量低于正常乳腺组织(0.42 vs 1.27,P=0.000),其与年龄(U=134 190.000,P=0.046)、人种(χ2=30.030,P=0.000)、淋巴结状态(U=126 697.000,P=0.003)、ER(U=69 435.000,P=0.000)、PR(U=99 978.000,P=0.000)、HER2(U=53 388,P=0.000)相关,以年龄≤55岁、黑人或非裔美国人、淋巴结阴性、ER阴性、PR阴性、HER2阴性者GnRH表达量较高。生存分析提示GnRH高表达组总生存期(overall survival,OS)优于低表达组(P=0.018)。乳腺癌组织中GnRHR表达量与正常乳腺组织相似(0.08 vs 0.07,P=0.778),其与年龄(U=133 325.000,P=0.031)、人种(χ2=16.829,P=0.000)、ER(U=68 438.000,P=0.000)、PR(U=92 714.500,P=0.000)、HER2(U=66 205.000,P=0.030)相关,以年龄>55岁、白人、ER阳性、PR阳性、HER2阴性者GnRHR表达量较高。GnRHR高表达组与低表达组间OS差异无统计学意义(P=0.719),亚组分析发现在三阴性乳腺癌亚组中GnRHR高表达组OS优于低表达组(P=0.028),而在非三阴性亚组中GnRHR与OS无相关性(P=0.976)。结论GnRH、GnRHR表达与乳腺癌部分临床病理学指标存在相关性,与乳腺癌(尤其是三阴性乳腺癌)的预后存在相关性。GnRH、GnRHR信号通路可能具有抑癌活性。

  • 标签: 乳腺癌 促性腺激素释放激素 促性腺激素释放激素受体 信使RNA