目的——利用R语言中的DrImpute包对缺失值进行插补研究。方法——通过距离度量Spearman和Pearson相关性计算细胞细胞距离矩阵,然后基于期望簇数k范围内的距离矩阵(k在默认情况下为10到15)进行细胞方向聚类。对于Spearman或Pearson和k的每个组合,输入基因细胞矩阵中的零值。所有组合的平均估计作为最终的估算值,来进行缺失事件缺失值的估算,对已知9个scRNA-seqdatasets实验进行验证。结果许多现有的统计工具(pcaReduce、SC3、PCA、t-SNE、Monocle和TSCAN)没有考虑到解决scRNA-seq细胞聚类,可视化和谱系重构这三个流行的研究领域的缺失事件,DrImpute在此基础上对缺失事件进行了极大的改进。结论——在对于区分“dropout”和真实零值方面DrImpute有着更好的性能,同时对现有的细胞类型识别工具的性能进行了提高,在Monocle和TSCAN在谱系重建中的性能方面和PCA和tSNE在
数据可视化方面也极具优势。