蛋白质组学第8期 文章复现之数据处理

第七期内容我们介绍了使用Perseus 进行数据预处理,这期接着上期预处理的内容,开始数据分析。

1.聚类热图

1)Z-score normalized

Z-score 归一化

img
img
Z-Score 讲解

引用自(https://blog.csdn.net/Orange_Spotty_Cat/article/details/80312154)

Z-Score的目的:Z-Score的主要目的就是将不同量级的数据统一转化为同一个量级,统一用计算出的Z-Score值衡量,以保证数据之间的可比性。

实例:

A班级的平均分是80,标准差是10,A考了90分;B班的平均分是400,标准差是100,B考了600分。我们可以计算得出,A的Z-Score是1((90-80)/10),B的Z-Socre是2((600-400)/100)。因此B的成绩更为优异。反之,若A考了60分,B考了300分,A的Z-Score是-2,B的Z-Score是-1。因此A的成绩更差。

优缺点:

  • 优点:

Z-Score最大的优点就是简单,容易计算,在R中,不需要加载包,仅仅凭借最简单的数学公式就能够计算出Z-Score并进行比较。此外,Z-Score能够应用于数值型的数据,并且不受数据量级的影响,因为它本身的作用就是消除量级给分析带来的不便。

  • 缺点

但是Z-Score应用也有风险。首先,估算Z-Score需要总体的平均值与方差,但是这一值在真实的分析与挖掘中很难得到,大多数情况下是用样本的均值与标准差替代。其次,Z-Score对于数据的分布有一定的要求,正态分布是最有利于Z-Score计算的。最后,Z-Score消除了数据具有的实际意义,A的Z-Score与B的Z-Score与他们各自的分数不再有关系,因此Z-Score的结果只能用于比较数据间的结果,数据的真实意义还需要还原原值。

2) 热图

2.火山图

1) 注释数据

2)火山图

3)图片保存

修改成你想要的图片之后,点击

3.本期任务

将两种细胞的数据进行预处理,并制作热图和火山图。

(0)

相关推荐

  • 推荐系统中常用的权重计算方法

    前言 说起推荐方面的技术,大家首先提到的往往是回归.Learning to rank这些数据挖掘或者说机器学习方面的名词,连协同过滤都少提了,可能是因为它太基础.然而基础的才是最重要的,实际上给推荐效 ...

  • 盘点数据挖掘包括哪些部分?

    大数据的时代我们人人身处其中,那么对于大数据的挖掘就是十分有价值的了,数据挖掘包括以下三点: 数据预处理 之所以有这样一个步骤,是因为通常的数据挖掘需要涉及相对较大的数据量,这些数据可能来源不一导致格 ...

  • Excel数据清洗之十三 异常值

    什么是异常值 异常值是一个统计学上的名词,指的是样本中的一些数值明显偏离其余数值.比如, 上图中我们统计了人群中一个样本的身高数据.从图上看,很明显,大部分数据都是以厘米为单位,只有第6个数据是以米为 ...

  • 免费!Esquisse教程3|这个只用点一点就能出图的工具我们来教你!

    Esquisse 一.精彩回顾 相信大家在昨日试着用Esquisse去画火山图都收获满满.(什么,你还不知道我们的Esquisse学习计划吗?快去往期回顾一下,<免费!这个只用点一点就能出图的工 ...

  • 《大话脑成像》八:组水平标准化

    2018已经到来,值此新春佳节之际,作为西南地区第一颜值担当的我继续为大家带来更加丰富多彩,干货满满的脑影像处理中的一些关键知识点讲解,并且不要19888,也不要198,完全免费,下面就由非常高端非常 ...

  • 蛋白质组学第4期 文章搜库过程复现

    上周我们公布了,蛋白质组学习小组起飞啦!  短短几天就获得了250多小伙伴的支持,让我们也更有信心的带领大家掌握一个蛋白质组学数据处理的实战,前面两期我们分享的是: 蛋白质组学第1期-认识基础概念 蛋 ...

  • 蛋白质组学第9期 文章数据分析之差异蛋白筛选和功能分析

    蛋白质组学第1期-认识基础概念 蛋白质组学第2期-认识蛋白质组学原始数据 蛋白质组学第3期-蛋白质组学的三大元素 蛋白质组学第4期 文章搜库过程复现 蛋白质组学第5期搜库软件之 MaxQuant 再介 ...

  • 蛋白质组学第7期 复现文章数据- 预处理之Perseus 的使用

    蛋白质组学第1期-认识基础概念 蛋白质组学第2期-认识蛋白质组学原始数据 蛋白质组学第3期-蛋白质组学的三大元素 蛋白质组学第4期 文章搜库过程复现 蛋白质组学第5期搜库软件之 MaxQuant 再介 ...

  • 往期文章链接汇总贴210504

    最近在写系列是"缅甸空战",更新日期一般在每周五的晚上~ [缅甸空战=入口][印度洋作战=入口] 两个视频系列: [沉舰系列=入口](完结) ~主要内容是海燕号科学考察船二战沉舰探 ...

  • SCI生信文章复现系列(一)—基因在各癌种及器官中的表达分布

    人人向往的生信文章究竟是怎么做出来的?生信小白如何从零起步,读懂生信图.做出漂亮的生信图片?SCI生信文章复现系列为你打开新世界大门,带你逐一复现生信SCI全文图片,手把手教你发生信SCI!本节将为大 ...

  • get小技能:如何快速查找你想要的往期文章?

    不知道大家知不知道一个技能 那就是进入某个公众号(如微生太),可以直接通过输入关键词来查找相关文章. 动图演示 无论是题目还是文中只要包含该关键词,都会列出来. 想要查看微生太往期文章的朋友用这个方法 ...

  • 互助问答第462期:关于两期家庭混合截面数据处理问题问题

    关于两期家庭混合截面数据处理问题问题 各位老师好,请教一个问题.问题背景:两期(两个季度)家庭混合截面数据,因变量Y是0-1哑变量(家庭层面):关注变量X为城市层面的连续变量,中介变量M为0-1哑变量 ...

  • 【老谢侃文】今日开栏,首期文章:写作文,其实并不难!

    写作文,其实并不难  常听学生家长抱怨:孩子写作文无从下笔,想破脑壳都挤不出几个字来.也曾听说过不少学生写作文,不是自己写,而是找本作文选来参照,其实就是"抄"!整段抄,全篇抄!考 ...

  • 往期文章汇总(无极桩 松 混元桩 李小龙 孙禄堂 丹道)

    无极桩 杨振基传:杨式太极的"无极桩"与"抱腹桩" 科学解析:无极桩原理及练法解析 武医视角:无极庄的动作要领析解 习练心得:无极桩要均匀分气,不能丹田贯气(视 ...