RNAseqChIP根据RNA-seq表达谱分析得到的结果,绘制对应基因启动子区的ChIP-seq信号,观察转录因子对基因的调控影响。一般可应用场景:测了RNA-seq和ChIP-seq,结合转录因子结合情况分析基因表达;只测了RNA-seq,补充相关ChIP-seq公共数据。基本原理:染色质免疫共沉淀技术(ChromatinImmunoprecipitation,ChIP)也称结合位点分析法,是一种研究蛋白质与染色质结合情况的方法。将ChIP与第二代测序技术相结合的ChIP-Seq,能够高效地在全基因组范围内检测与组蛋白、转录因子等互作的DNA区段。转录组测序RNA-seq,获取的转录组基因表达情况,结合ChIP-seq数据,可以从更宏观的角度分析转录因子调控的对基因表达的影响。数据要求:基因列表,ChIP-seq数据。 两个实验组的差异基因比较。北京临床统计数据科学售后分析
术语解读
数据降维:
降维就是一种对高维度特征数据预处理方法。降维是将高维度的数据保留下**重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。在实际的生产和应用中,降维在一定的信息损失范围内,可以为我们节省大量的时间和成本。降维也成为应用非常***的数据预处理方法。
数据要求:
表达谱芯片或测序数据(已经过预处理)
下游分析
得到PCA分析结果之后的分析有:
1.对组成主要成分的基因进行后续分析,探究该情况下关键基因表达情况
2.对组成不同主成分簇的基因进行后续分析,探究该情况下不同基因集的表达情况 湖北算法还原与开发数据科学口碑推荐提供语言润色、图表调整、格式修改等工作模块。
STEM基因表达趋势分析数据要求表达谱芯片或测序数据(已经过预处理)下游分析得到***富集的时间表达模式之后的分析有:1.时间表达模式中基因的功能富集2.时间表达模式中基因表达与性状之间的相关性挖掘模块的关键信息:1.找到时间表达模式中的**基因2.利用关系预测该时间表达模式功能文献1:DynamicEBF1occupancydirectssequentialepigeneticandtranscriptionaleventsinB-cellprogramming(于2018年1月发表在GenesDev.,影响因子)EBF1动态占据在B细胞中对序列表观遗传和转录过程的影响该文献采用基因表达趋势分析,探寻了EBF1诱导前后25kb转录起始位点内基因转录水平的差异,来寻找EBF1对特定功能基因的影响以及造成影响的时间节点。文献2:ComprehensivetranscriptionalprofilingofNaCl-stressedArabidopsisrootsrevealsnovelclassesofresponsivegenes(于2016年10月发表在BMCPlantBiol.,影响因子)该文献采用基因表达趋势分析,研究了高浓度盐水作用不同时间下拟南芥根的基因表达差异,来探寻在遇到高浓度盐水时拟南芥在基因层面上的应对方式。
单细胞测序数据挖掘:GEO目前收录的单细胞研究样本已经超过2万例,单细胞测序几乎成为生物医学领域CNS***文章的标配。实验费用高昂,阻断了CNS梦,既然其他数据可以挖,单细胞测序数据照样可以挖。已知公共数据库中单细胞测序数据涉及各种疾病类型,包括**、免疫细胞、炎症类甚至神经、肌肉、骨骼等,样本丰富、数据庞大,你不挖就是失去了一座金山。我们提供各种设计单细胞测序、各种测序、芯片、多组学的公共数据库挖掘、培训、模型构建、临床统计、算法还原服务;你能想到,我能做到;你提供参考文献、思路和目的,我们提供结果;如果没有思路,我们提供付费科研设计服务。示例如下:利用公共数据库的1539个单细胞样本,构建自己的生物学故事。 构建新的临床预测模型。
pancancer泛**图谱泛*研究是通过整合不同**类型、不同组织起源的**表达数据,查找**之间的共性或者差异的过程。通常使用**数据信息较为***的TCGA数据,通过分裂小提琴图展示某个基因在TCGA**和正常组织中的表达差异。分裂小提琴图(ViolinPlot)结合了箱形图和密度图的特征,主要用来显示数据的分布形状,它一般应用于对比某一基因在TCGA**组织和正常组织基因表达量TPM值或其它表达量数据。基本原理:小提琴图(ViolinPlot)使用一组数据中的最小值、**四分位数、中位数、第三四分位数和**值来反映数据分布的中心位置和散布范围,将多组数据的小提琴图画在同一坐标上,可以清晰地显示各组数据的分布差异。分裂小提琴图在小提琴图的基础上又加入了分组对比项,便于观察多**类型在某一基因上的表达分布情况,或者某一基因在某一**上,其疾病与正常的对比表达差异情况。 文稿投稿2个月online 发表。山东组学实验数据科学售后分析
基因组数据全链条处理、蛋白组代谢组个性化分析。北京临床统计数据科学售后分析
PPImodule蛋白质互作蛋白质-蛋白质相互作用(protein-proteininteraction,PPI)是指两个或两个以上的蛋白质分子通过非共价键形成蛋白质复合体(proteincomplex)的过程。PPImodule是指共表达蛋白模块或蛋白质相互作用模块。蛋白质相互作用形成人体复杂的蛋白质相互作用网络,对蛋白质相互作用网络进行聚类形成模块从而帮助我们理解细胞的功能。我们一般使用PPImodule把基因列表跟蛋白相互作用网络联系起来。例如RNA-seq获得的差异表达基因,看他们在蛋白相互作用网络中,哪些基因处于同一module。基本原理:蛋白质在细胞中的功能取决于它与其他蛋白质、核酸和小分子相互作用关系,对蛋白质相互作用网络进行聚类形成模块,各个蛋白模块发挥不同的功能,我们将基因列表重叠于模块上,查找基因列表所在的功能模块,从而发现基因列表中的基因可能发挥的细胞功能。我们通过PPI数据库找到共表达蛋白中的module,然后从模块中筛选出基因列表的产物蛋白,筛选出的结果就是基因列表***表达的PPImodule。 北京临床统计数据科学售后分析