企业商机
数据科学基本参数
  • 品牌
  • 云生物,数据科学
  • 服务内容
  • 软件开发,软件定制,技术开发
  • 版本类型
  • 普通版,正式版,标准版,企业版,升级版
  • 适用范围
  • 企业用户
  • 所在地
  • 上海,北京,广州
数据科学企业商机

    GeneInteraction基因互作:基因相互作用指miRNA、lncRNA、circRNA或其它RNA介导DNA转录,从而影响mRNA的表达过程。通俗意义上来说,基因互作关系指基于序列预测的靶基因对。miRNA通过与靶mRNA的结合,或促使mRNA降解,或阻碍其翻译,从而***目的基因的表达。竞争性内源RNA网络是靶基因预测的研究深入,简称ceRNA网络。通过进行ceRNA网络的分析,我们能从一个更为宏观的角度来解释转录体如何构建基因表达调控网络,从而进一步挖掘基因在其中的调控机制。基本原理:miRNA主要通过与靶基因的非翻译区(UTR)结合而发挥其作用,对miRNA和mRNA、lncRNA、circRNA结合进行的预测称为靶基因预测。靶基因预测使用软件根据miRNA和靶基因间的结合的规律预测结合基因对。在生物体内,miRNA可以通过与proteincoding特异性结合,影响相关基因的表达,从而参与调控细胞内的各项功能。ceRNA具有miRNA结合位点,能后竞争性地结合miRNA,***miRNA对靶基因的调控。例如lncRNA与miRNA竞争性结合,影响miRNA调控mRNA的过程,**终导致的mRNA表达失调。我们使用基于序列预测的软件对差异分析得到的miRNA与mRNA,lncRNA,circRNA进行靶点预测和ceRNA网络分析。 基因富集分析是在一组基因中找到具有一定基因功能特征和生物过程的基因集的分析方法。天津生物/药物信息学分析数据科学经验丰富

术语解读

数据降维:

降维就是一种对高维度特征数据预处理方法。降维是将高维度的数据保留下**重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。在实际的生产和应用中,降维在一定的信息损失范围内,可以为我们节省大量的时间和成本。降维也成为应用非常***的数据预处理方法。


数据要求:

表达谱芯片或测序数据(已经过预处理)


下游分析

得到PCA分析结果之后的分析有:

1.对组成主要成分的基因进行后续分析,探究该情况下关键基因表达情况

2.对组成不同主成分簇的基因进行后续分析,探究该情况下不同基因集的表达情况 云南文章成稿指导数据科学专业服务云生物立足于上海,提供相关数据科研咨询与服务。

    不同分组的全基因组拷贝数变化的比较:**初目的:不同分组的拷贝数变异在染色体水平和染色体臂水平的展示和比较。应用:不同分组的全基因组拷贝数变化的比较,展示genome-wideDNAcopy-numberprofiles。不同染色体臂的变异与临床表型息息相关。输入数据格式:一个表征每个样本的染色体变异(gain,balance,loss)的数值矩阵和样本分组信息。或者拷贝数的原始结果,可处理成所需矩阵。参考文献:(2)::本文计算出病人的拷贝数变异情况后,按照之前病人的分组比较了不同分组的染色体变异的异同,找到特定的染色体变异模式。确定了各组的特征,如lmonosomy2inPFB2,monosomy8inPFB3,monosomy3inPFB1,andgainof1qinPFB1.。

    STEM基因表达趋势分析基因调控网络是一个连续且复杂的动态系统。当生物体按照一定顺序发生变化或者受到外界环境刺激(如受到不同浓度的化学药物诱导)时,基因表达变化也会呈现趋势特征。趋势分析就是发现基因表达的趋势特征,将相同变化特征的基因集中在一种变化趋势中,从而找到实验变化过程中相当有有代表性的基因群。STEM(ShortTime-seriesExpressionMiner),中文名短时间序列表达挖掘器。该软件主要用于分析短时间实验数据,也可用于多组小样本数据。推荐3至8组数据。一般可应用的研究方向有:多个时间点的时间序列数据,例如多个发育时期、处理后多个时间点取样。基本原理STEM采用了一种新的聚类算法来分析时间序列基因表达趋势。聚类算法首先选择一组不同的、有代表性的时间表达模式(temporalexpressionprofiles)作为模型(modelprofiles)。模型是**于数据选择的,并从理论上保证了所选择的模型剖面具有代表性。然后,根据每个标准化过后的基因表达模式,分配给模型中相关系数比较高的时间表达模式。由于模型的选择是**于数据的,因此该算法可以通过排列测试,确定哪些时间表达模式在统计意义上***富集基因。对每一个基因都分配时间表达模式完成后。 糖尿病药物基因组学分析找到新的作用靶点。

棒棒糖图是直观显示蛋白质结构上的突变点**简单且有效的方式。许多致*基因具有比任何其他基因座更频繁突变的优先位点。这些位点被认为是突变热点,棒棒糖图可以用于显示突变热点以及其他突变位点。并可以对比不同**/亚型的突变位点。

基本原理

将蛋白质结构根据氨基酸顺序绘制为长条形,以不同色块标注不同结构域,在基因突变导致氨基酸改变的位置标注棒棒糖,并在棒棒糖圆球标注位点的突变频数以及突变位点。

数据要求

基因突变或者蛋白质突变数据


下游分析

1、突变位点靶向药物分析

2、驱动基因突变分析 乳腺类疾病预后相关信性基因突变研究数据包。辽宁数据科学专业服务

circos图通过圆圈和连线展示多个亚组之间的关系,包括且不限于基因、基因片段、亚型。天津生物/药物信息学分析数据科学经验丰富

    GSEA数据要求1、通常为表达谱芯片或测序数据(已经过预处理),也可以是其他形式可排序的基因数据。2、具有已知生物学意义(GO、Pathway、**特征基因集等)的基因集。下游分析:得到GSEA结果之后的分析有:1.基因注释:1、绘制基因集富集趋势图(Enrichmentplot)横坐标:按差异表达差异排序的基因序列。数值越小(偏向左端)的基因**在shICAM-1组中有越高倍数的差异表达,数值越小(偏向右端)的基因在对照组中有越高倍数的差异表达。纵坐标:上方的纵坐标为富集打分ES,ES是一个动态的值,沿着基因序列,找到条目中的基因则增加评分,否则减少评分。通常用偏离0**远的值作为**终富集打分。下方的纵坐标**基因表达与表型的关联,***值越大**关联越强,数值大于0**正相关,小于0则**负相关。 天津生物/药物信息学分析数据科学经验丰富

与数据科学相关的产品
与数据科学相关的**
信息来源于互联网 本站不为信息真实性负责