ID | 产品编号 | 名称 | 英文名 | CAS编号 | 产地 | 规格 | 询问 |
---|---|---|---|---|---|---|---|
539229 | GBW09901 | 中华家系1号(同卵双胞胎家庭-母亲)人源B淋巴细胞系全基因组DNA序列标准物质 | 中国 | 50μL/管*4(冰袋运输,-80˚C低温长期保存) | 咨 询 |
系列编号: 1 号(同卵双胞胎家庭)人源 B 淋巴细胞系全基因组 DNA 序列标准物质可用于评估基因组测序的性能,包括全基因组测序、全外显子测序、靶向测序和甲基化测序。主要性能评价指标包括:1)基于标准参考数据集的精密度和召回率;2)基于同卵双胞胎家系关系的孟德尔一致率。本标准物质可用于评估基因组测序的全过程,包括文库构建、测序,及序列比对和变异识别等生物信息分析过程。不适用于评估建库前的 DNA 提取等样本预处理,及功能注释、临床解读等生物信息学分析过程。
一、样品制备
本标准物质是从人源 B 淋巴细胞系 FUDAN_M8 中提取纯化的基因组 DNA,每个包装单元包含10 μg 基因组 DNA,DNA 主峰片段>60 Kb,溶解于 TE 溶液(10 mM TRIS, 1 mM EDTA, pH 8.0)。
二、溯源性及定值方法
本标准物质的标称特性标准参考数据集包括单核苷酸变异、短插入缺失变异、结构变异和 5’-甲基胞嘧啶位点及丰度。
单核苷酸变异和短插入缺失变异标准参考数据集的确定,采用两种测序技术(Illumina 和 MGI),在 6 家认证实验室产出全基因组测序数据,并采用经优化确证的可重复的生物信息学分析流程(Sentieon Genomics)进行分析,获得 27 个变异集合。按照“重复性”原则进行整合,并通过同卵双胞胎家庭的家系关系排除测序错误,获得高置信的单核苷酸变异信息(VCF 文件)和高置信的短插入缺失变异的信息(VCF 文件),以及相应的高置信参考基因组区域的序列信息(Bed 文件),作为标准参考数据集。
高置信结构变异标准参考数据集的确定,采用 Pacific Biosciences (PacBio)和 Oxford Nanopore Technologies (ONT) 两种测序技术,在 3 家认证实验室产出全基因组测序数据,并采用经过验证的 3个比对软件(NGMLR、minimap2 和 pbmm2)和 5 个变异检测软件(Sniffles、NanoSV、cuteSV、SVIM和 pbsv)分析,获得 30 个变异集合。按照“重复性”原则进行整合,并通过同卵双胞胎家庭的家系关系排除测序错误,获得高置信的结构变异(SV)信息(VCF 文件),以及相应的高置信参考基因组区域的序列信息(Bed 文件),作为标准参考数据集。
高置信甲基化信息标准参考数据集的确定,采用全基因组甲基化测序(WGBS)和 850K 甲基化芯片两种技术,在 5 家认证实验室产出数据,并采用经优化确证的生物信息学分析流程(Bismark 和 minfi)进行分析,获得 15 个 5’-甲基胞嘧啶位点和丰度集合。进一步按照“重复性”原则进行整合,获得高置信的 5’-甲基胞嘧啶标准参考数据集。
标准物质的标称特性标准参考数据集中的每个特性值都可以溯源至人类参考基因组 GRCh38。
三、特性量值及可信度
单核苷酸变异和短插入缺失变异标准参考数据集 v1.0 版本覆盖 87.8%的 GRCh38 基因组区域,结构变异标准参考数据集 v1.0 版本覆盖 85.5%-86.5%的 GRCh38 基因组区域,具体信息见表 1,高置信变异集合的可信度见表 2。可信度评定主要考虑了标称特性确定过程中的不同测序平台、不同技术重复、不同建库方法、不同分析方法引入的贡献。
表 1. 高置信变异集合数目及对应的高置信基因组区域
名 称 编号 总变异个数 数目(个) 结构变异 数目(个) 中华家系1号(同卵双胞胎家庭-母亲)人源B淋巴细胞系全基因组DNA序列标准物质 GBW09901 单核苷酸变异(SNV)个数 4,212,376 总变异个数 14,893 短插入缺失变异(INDEL)个数 3,597,864 插入变异(INS)< 1k 7,161 杂合变异/纯合变异(Het/Hom) 608,750 插入变异(INS)≥ 1kb 717 同类核苷酸变异/不同类核苷酸变异(SNV Ti/Tv) 1.38 缺失变异(DEL)< 1kb 6,324 高置信区间长度 (bp) 2 缺失变异(DEL)≥ 1kb 691 总变异个数 2,663,576,745 高置信区间长度 (bp) 2,596,140,552 2.高置信变异集合数据对应的可信度区间
可信度(%) 简单变异集合 结构变异集合 单核苷酸变异(SNV)个数 短插入缺失变异(INDEL)个数 插入变异(INS)个数 缺失变异(DEL)个数 >95 3,569,921 585312 4,753 3,869 90~95 10,348 9953 1,066 1,337 85~90 11,004 8675 799 668 80~85 2,634 2050 414 376 75~80 1,856 1499 318 296 70~75 1,630 1041 292 138 65~70 309 155 244 110 60~65 103 47 171 80 55~60 58 16 137 68 50~55 1 5 106 55 45~50 0 0 106 52 40~45 0 0 65 55 四、5’-甲基胞嘧啶标准参考数据集
5’-甲基胞嘧啶标准参考数据集 v1.0 版本包括了全基因组范围内 412,352 个 5’-甲基胞嘧啶的位点及丰度信息。5’-甲基胞嘧啶标准参考数据集中甲基化数目及丰度对应的不确定度区间见表 3。
不确定度评定主要考虑了标准值确定过程中甲基化分析方法的重复性、均匀性和稳定性引入的贡献。
表 3. 5’-甲基胞嘧啶数目及丰度对应的不确定度区间
不确定度 (%) <10 10~20 20~30 30~40 40~50 50~60 5’-甲基胞嘧啶数目(个) 103,012 213,228 68,089 22,092 5,095 836 五、均匀性和稳定性评估
参照 JJF1343 国家计量技术规范(等效 ISO 指南 35),采用高通量测序方法对标准参考数据集中的简单变异和甲基化丰度进行均匀性分析,结果表明均匀性良好。按照先密后疏的原则采用芯片电泳方法对 DNA 的完整性(DNA Integrity Number, RIN)进行稳定性评估,完整性无方向性变化并通过平均值一致性检验,表明稳定性良好。同时采用高通量测序法对 SNV 和 INDEL 进行了稳定性评估,通过分析不同时间点的 SNV 和 INDEL 与标准参考数据集比较的 F1 分数,没有显著差异,表明稳定性良好。研制单位将继续跟踪监测该标准物质的稳定性,有效期内如发现变化,将及时通知用户。
六、包装、储存及使用
1.包装规格:本标准物质采用 0.5 mL 立式拧口塑料离心管包装,50 μL/管,最小取样量根据各测序平台的建库要求确定。
2.保存及运输条件:建议-80˚C 低温长期保存。采用冰袋运输,收到标准物质后应检查无误才可用于实验。
3.使用前应先从冰箱内取出,平衡至室温后再打开瓶盖使用。使用后建议尽快恢复密封状态,并置于-80℃长期保存。
七、标准参考数据集的更新
随着高通量基因组测序技术和分析算法的进步,标准参考数据集将定期发布升级版。