管理体系认证

ISO9001体系认证 ISO14001体系认证 ISO13485体系认证 ISO50001体系认证 ISO27001体系认证 GB/T50430体系认证 ISO20000体系认证 ISO45001体系认证 售后服务认证 HACCP体系认证

产品认证

医疗器械认证

防疫用品认证

护目镜认证 防护手套认证 防护服认证 口罩认证 防疫用品认证

推荐项目
ISO9001体系认证
英格尔检测
当前位置  英格尔  >  检测项目  >  其他检测  >  第三方检测机构  

主成分分析PCA

发布时间:2022-10-27 来源: 英格尔集团 点击:142
   当我们得到很多种报告时,它们可能都包括PCA图、二维坐标或三维坐标散点图,图中的点或聚集或分散,可能用不同的颜色标记。看起来像是夜空中最亮的烟花,第一眼可能真的很难琢磨。什么是PCA?为什么它有如此重要的地位?从PCA结果中我们可以看出什么信息?

  PCA主成分分析的全称,也就是主成分分析,听起来很简单,让人耳目一新,但是这个主成分的三个字里却有玄机。简单来说,主成分分析(PCA)就是通过正交变换将一组变量转化为另一组变量,从而达到数据降维目的的分析方法。这组转换后得到的变量就是我们所说的主成分。

  降维?健康是什么?降维打击?可能概念比较直接抽象,先举个栗子。例如,我们有一组通过重测序获得的变异数据,有n个突变位点,或者一组转录表达数据,有n个转录表达信息。那么我们就相当于拥有了一组N个变量,这个变量可能很大,可能随便几万甚至上亿。直接比较两个或两个以上的数据显然是非常困难的。并且通过主成分分析,将这样一组包含n个变量的数据转换成一组包含r个变量的数据,其中r

主成分分析PCA

  你在这里可能会问,这个过程我理解,但是为什么数据转换之后,更多的变量变成更少的变量?不会丢失很多信息吗?如果你考虑了这个问题,那么恭喜你,说明你对主成分分析有了深入的思考。

  在我们得到的第一组变量中,变量并不是完全相互独立的。比如我们的一个基因座发生突变,那么几个连锁的基因座也会大概率发生突变;或者一个基因的表达发生了变化,同一途径的其他基因的表达也会大概率发生变化,即变量之间存在相关性。极端点,假设两个位点完全连锁,那么我们去掉一个突变的所有信息,不会影响总的信息量。主成分分析就是基于这样一种思想,根据变量的相关性对变量进行分解、合并和降维,类似于从N维空间到R维空间的投影。如果你对具体的计算方法感兴趣,有很多相关的资料可以参考,当然也有很多工具可以方便我们直接对数据进行主成分分析。

  那么,PCA图在我们的报告中说明了什么问题呢?

  在分析的过程中,PCA可以让我们直观的看到样本之间的相似性。例如,在PCA散点图中,几个样本的点聚集在一起,这意味着这些样本之间的相似度非常高;相反,如果几个样本的点非常分散,那么这些样本之间的相似度就低。比如下图,几组样本对应的散点在组内呈现相互聚集,说明组内重复性好,样本数据非常相似,组间的区分度好。有时为了说明一组样本的相似性,会用一个椭圆来覆盖同一组样本对应的所有散乱点。

英格尔,聚力价值信任

  • 标准规范
    |
  • 合作伙伴
    |
  • 仪器设备
    |
  • 集团优势

恪守全球标准规范


英格尔检测

大型企业、政府机构、高效研发机构


英格尔检测

一线品牌(沃特世、赛默飞、安捷伦、戴安等)高配实验室设备


英格尔检测

全方位的服务内容,多领域的服务能力,规模化的服务平台、高品质的服务质量


英格尔检测

上一篇:质检报告 下一篇:没有了