全面的基因组覆盖范围:检测>853,307个CpG位点,全面覆盖CpG岛、启动子、编码区及增强子
高质量的数据:沿用了450k芯片的Infinium技术,同时采用Infinium I及II探针设计,使检测范围最大化
分辨率高:单碱基分辨率,可以直接检测到发生甲基化的准确位点
可重复性高:自身技术重复间的相关性以及与450K相同探针间的相关性R2 >0.98
起始模板量低: 仅需 250ng,大大节约了样品量
适用于FFPE样品
样本类型
动、植物组织、细胞等
每个样品总量不少于2ug,最低浓度不低于50ng/ul,OD 260/280值应在1.7~1.9 之间,
基因组完整、无降解、无RNA污染。
A:进入亚硫酸氢盐转化,手动方案至少需要500 ng,自动化方案至少需要1000 ng。
A:这是一种双色测定。对于基于Infinium I Assay设计的Infinium HumanMethyation27 BeadChip测定,掺入的颜色取决于被查询的CpG基因座之前的碱基。这可以是绿色或红色。Infinium HumanMethylation450 BeadChip测定包括Infinium I和Infinium II研究设计。在后一种情况下,从探针序列的3'末端(其是查询碱基上游的一个碱基)的单个碱基延伸将导致红色或绿色信号,这取决于查询位点是否未甲基化或甲基化。
为了探索I期非小细胞肺癌(NSCLC)可利用的生物标志物,本案例采用 Illumina 450K甲基化芯片对444例非小细胞肺癌样本进行研究,发现了10000个甲基化差异位点。基于这些位点进行非监督层次聚类分析,可以将患者明显区分为预后好坏两类。
图1. 非小细胞肺癌样本的非监督层次聚类分析
本案例利用Illumina 450K甲基化芯片研究了多发性硬化影响的脑组织与正常脑组织的DNA甲基化差异,结果发现甲基化差异细微,但是差异是普遍存在的并且具有可重复性。通过RNA-seq研究发现,多发性硬化影响的脑组织相比正常脑组织,调节少突胶质细胞存活的基因,如BCL2L2和NDRG1是高甲基化的并且基因表达水平较低;而与蛋白水解加工相关的基因,如LGMN和CTSZ则是低甲基化并且基因表达水平较高。这些结果表明基因甲基化程度的改变会影响脑组织对于损伤的敏感性。
图2. mRNA表达水平与启动子甲基化相关性分析
[1] Sandoval J, Mendez-Gonzalez J, Nadal E, et al. A Prognostic DNA Methylation Signature for Stage I Non–Small-Cell Lung Cancer. Journal of Clinical Oncology, 2013; 31(32): 4140-4147.
[2] Huynh J, Garg P, Thin T, et al. Epigenome-wide differences in pathology-free regions of multiple sclerosis- affected brains. Nature neuroscience, 2014; 17(1): 121-130.
在全世界分范围内,每年因肝癌死亡的病例超过50万人,是主要的因癌死亡病因之一。在过去的十年中,随着影像学的进步以及健康体检的普及,越来越多的肝癌病人在患病早期被发现。但由于肝脏捐赠者的短缺,外科肝脏切除术仍然是治疗早期肝癌病人的最主要方法。本研究建立了一种预测早期肝癌病人术后复发的模型。
1. CpG位点选择
研究者首先采用焦磷酸测序技术验证了450k芯片数据的再现性。通过分析66例病人的FFPE样本和新鲜冷冻组织样本发现,随机选择的两个CpG位点甲基化水平呈现出高度的一致性。采用△β>0.15,FDR<0.01和p value<0.01这一标准,过滤450K芯片结果,得到2550个差异CpG位点。随后,研究者为了区分高风险和低风险的病人,采用LASSO和SVM-RFE算法分别得到了30个差异最显著的CpG位点。
2. 探究可预测的标签
通过比较两种算法得到的CpG位点,发现有14种是同时被鉴定出的,46种是不同的。通过分析46种不同CpG位点,把66例样本分成复发和不复发两个亚类。研究者随后采用Cox回归模型在训练组中进一步缩小了E-HCC病人的甲基化检测位点。结果发现,cg20657849(SCAND3), cg19406367(SGIP1), 和 cg19931348(PI3)三个甲基化位点与E-HCC病人复发高度相关。
随后研究者采用焦磷酸测序技术,分别在训练组和鉴定组中量化这一发现。为了更好的研究这三个CpG位点用来预测E-HCC复发的准确性,在训练组中设定了一种危险系数评分。(risk score = (0.104 ×SGIP1甲基化水平) + (-1.125 ×SCAND3甲基化水平) + (-0.085 × PI3甲基化水平))研究发现,-0.401为risk score阈值。
3. 证实这一标签
为了证实这一模型的稳定性,研究者分别在一组内部样本和两组外部样本进行了检测。在内部样本中,该模型成功的分类了68例复发高风险病人,73例低复发风险病人。在外部样本中,同样成功分类了高风险和低风险病人。ROC分析发现,MSEH预测早期肝癌病人复发比三个CpG位点单独检测更有效。
4. 建立可预测的诺模图
为了建立临床上适用的用来预测个体复发的模型,综合考虑了协变量后,研究者用诺模图建立了可以用来预测的模型。基于RFS的多变量分析,研究者生成了一个诺模图预测患者的5年生存率,通过三个校正点的检测均得到理想结果。
本文通过分析早期肝癌患者甲基化芯片结果,得到三个与早期肝癌患者复发相关的CpG位点,并通过训练组和验证组优化了这一预测模式。最终,研究者建立了一种诺模图,用来预测早期肝癌患者的术后复发风险。
案例四:甲基化研究揭示鼻咽癌治疗新靶点
在中国华南地区,鼻咽癌有较高的发病率。目前,鼻咽癌病人的治疗方案主要取决于病人的TNM分期。但是,约30%的鼻咽癌
甲基化高级分析A. 甲基化与表达谱相关性热图,此类型的图也可展示其他不同组学的相关性。B. 基因组、转录组与甲基化组变异通路图,可在同一张图上展示通路中的基因组、转录组与甲基化组等不同组学上的变异,以及多组学的变异对通路的影响。C. 关键基因的多组学相关性图,以相关性图的形式,同时展示关键基因在基因组、转录组与甲基化等多组学层面上的相关性,共变异或甲基化状态。
HYBRIDIZATION 杂交图中横轴是log2(信号值),纵轴是样本名称。红色荧光表示未甲基化位点的log2(信号值),绿色荧光表示甲基化位点的log2(信号值)。结论:红色荧光和绿色荧光的差值一般是2个数量级。阳性参照中绿色探针产生的log2(信号值) >12,标记实验成功。
样本质控图横轴是log2(甲基化中位数值), 纵轴是(非甲基化中位数值),每个样本的整体甲基化程度一个圆点表示,其在虚线右上角分布则表示达到质控的标准。结论: 本研究全部样本达到质控的标准。