025-87183621
新闻资讯 新闻资讯

生信分析中的PCA图如何看

发布时间:2024-09-27
浏览次数:12020
作者:东极药物

作为成熟的生物医学科研人,必然是做实验、写论文、做生信分析……样样手到擒来!今天,我们再来接着解读PCA图~一、定义和用途定义:PCA(主成分分析图)是以“降维"为核心,把多指标的数据用少数几个综合指标(···

作为成熟的生物医学科研人,必然是做实验、写论文、做生信分析……样样手到擒来!今天,我们再来接着解读PCA图~

d532e442c8526d8bf6f13f36ad5cab25_1717731758608907.png

一、定义和用途

定义:PCA(主成分分析图)是以“降维"为核心,把多指标的数据用少数几个综合指标(主成分)替代,还原数据最本质特征的数据处理方式,用于展示多元数据的主要模式和结构。

用途:

常用于疾病危险因素分析、肠道菌群聚类分析、肿瘤亚群之间的进化关系分析等。

l 确定主成分的数量:通常来说,保留前几个主成分就足够解释原始数据的大部分变异。

l 异常值检测:通过观察PCA图中样本的分布情况,可以发现是否存在异常值。如果某个样本在各个主成分上的得分都明显偏离其他样本,则表示该样本为异常值。聚类分析:通过观察PCA图中样本的分布情况,将相似的样本归为同一类,不相似的样本归为不同类。

l 预测分析:如果已知某些样本属于某一类或具有某一标签,就可以在PCA图中找到这些样本的位置,并预测新样本的分类或标签。

二、PCA图怎么看(案例解读)

0d23d31b059d5b8cec308bdef95d964c_1717731770751526.png

为了测试肿瘤体积大的患者是否系统性地表现出其微生物群的变化,研究者使用Bray-Curtis指数测量了整个队列的β多样性。主成分分析(PCA)显示这些患者的β多样性无显著差异。

三、相关疑问和解答

1.什么是主成分?

主成分就是原始变量的线性组合。

第一主成分对应第一坐标轴,表示了原始数据中多个变量通过某种变换得到的新变量的变化范围,能够最大程度解释数据中方差的线性组合。

第二主成分则对应第二坐标轴,代表了第二个新变量的变化范围,能够最大程度解释数据中的方差。

2.PCA分析有哪些注意事项?

l 当我们遇到非线性的或高阶相关的变量关系时,就无法通过PCA分析发挥数据降维的作用。

l 当我们遇到两个变量的数值尺度相差较大时,必须先进行标准化处理,确保变量之间的数值尺度相同,才能进行PCA分析。

l 当我们进行PCA分析时,需要假设变量服从高斯分布,如果变量不服从高斯分布(例如均匀分布时),则会发生尺度缩放与旋转。

3.PCA图有哪些衍生类型?

(1)PCA散点图

dd9dde3c54af1593080b67156716ac8f_1717731780532807.png

(2)PCA双标图

d2f8ab872452ba3d971e34e93b2d6415_1717731796127660.png

(3)PCA三维图

7cae428ba271cc75dc66625bbaa7dc86_1717731804758894.png

(4)PCA山脊图



8628b981d6e08acb6d89cea09c2d1472_1717731818151220.png

本文标签:

在线留言

Online message

姓名

电话

留言内容

联系我们

Contact us
南京东极生物科技有限公司
扫一扫关注
  • 地址:南京市六合区新港湾路166号协合智谷产业园16-3栋
  • 电话:139-1599-6230   025-87183621
  • 邮箱:sales@dj-cro.com
  • 网址:http://haikou.dj-cro.com
Copyright © 2023 南京东极生物科技有限公司版权所有 All Rights Reserved.
  • 公司联系方式
    QQ
  • 公司微博
    微博
  • 网站首页
    首页
  • 公司联系电话
    电话
  • 返回
    返回顶部