揭秘芯片-探针比对(UCSCblat的简单使用)
揭秘芯片-探针比对(UCSCblat的简单使用)

不管是Agilent芯片,还是Affymetrix芯片,上面设计的探针都非常短。最长的如Agilent芯片上的探针,往往都是60bp,但是往往一个基因的长度都好几Kb,所以了解探针所杂交的位置是很有意义的,比如对于过表达的实验设计,一般是过表达CDS区域,而有时候探针会设计在3’UTR区域。对于这种情况,探针检测不到过表达的情况。这也是有很多老师反馈过表达的基因在芯片上面检测不到的主要原因之一。
我们可以借助UCSC的blat核对探针所杂交的情况。
举个例子:
对于Agilent小鼠商品化芯片,上面有一个基因是Tm6sf2,其对应的序列为:
>A_55_P2049122
CCCCTCCTGGAATCTAGCCATCACCTCTTCCCATACATTTAATAAAACCTTCTGATGTCT
ps:一般欧易生物的Agilent芯片报告中,差异筛选文件以及差异未筛选文件的注释中均包含探针序列(注释中表头为Sequence所在的列)。
打开Blat界面(http://genome.ucsc.edu/cgi-bin/hgBlat)
按照图上的顺序
step1:选择对应的物种,本次是小鼠芯片,故选择mouse;
step2:选择对应的基因组版本,小鼠的选择mm9,人的话建议利用hg19.之所以不选最新的数据库,是由于最新的数据库关联的信息比较少;
step3:将序列粘贴上去,可以提交多条fasta序列;
step4:提交。
Blat:结果解析1:
以上为Blat结果解析,主要是显示序列能匹配到的基因组位置,一般情况下,查看探针完美匹配区域即可,其他部分匹配区域,由于匹配序列不一样,其杂交条件存在区别,大多数情况下均杂交不上。本次结果中Score最高的结果(红框)即为探针所杂交的区域。点击browser即可查看探针位置有什么样本的转录本经过以及该探针位于基因的哪个位置(如下图)。
Blat结果解析2:
step1:一般Blat结果点击Browser时候,仅展示探针所在区域,为了便于更全面的查看,可以将查看区域进行放大,比如放大10倍,这样就更方便查看探针位置。
step2:探针序列所在位置,图中黑色框位置,上方标注“Your sequence from blat search”。
step3:Ensembl数据库中的转录本情况,细框表示非编码区域,粗框表示编码区域,细线表示内含子区域,粗框中的箭头表示转录方向。
step4:Refseq基因的转录本情况。
从上图可以得知,芯片上的该基因对应的探针序列是设计在基因的3‘UTR区域,同时检测这个基因的两个转录本。
同时,在网站上图表的下方还存在多个数据库,从基因结构到表型,以及各种调控关系均可以展示,可以很方便的查看特定区域在不同的数据库中的信息,从而可以横向比较特定的基因的信息。
“推荐阅读”
【责任编辑】:欧易生物版权所有:http://www.oebiotech.com转载请注明出处
本文链接: https://www.ebiomall.cn/b338-affymetrix/info-1556141135.html

