企业商机
数据科学基本参数
  • 品牌
  • 云生物,数据科学
  • 服务内容
  • 软件开发,软件定制,技术开发
  • 版本类型
  • 普通版,正式版,标准版,企业版,升级版
  • 适用范围
  • 企业用户
  • 所在地
  • 上海,北京,广州
数据科学企业商机

    术语解读:PPI:蛋白质-蛋白质相互作用(protein-proteininteraction)PPImoduleI:指蛋白质相互作用模块,一个模块指向一个功能数据要求:基因列表应用示例1:(于2018年3月发表在Immunity.,影响因子)T细胞活化过程中产生蛋白质组进行多重定量分析,然后对差异表达蛋白权重聚类,并将聚类蛋白叠加到PPI网络上以识别功能模块。D.模块大小的分布,通过将每个WPC(权重聚类结果)中的蛋白叠加到蛋白-蛋白相互作用(PPI)网络上识别模块。每个模块的蛋白质数量显示出来。E.各个模块及其交互的关系图。圆圈(节点)表示90个模块,圆圈大小与模块大小成比例。边连接共享PPIs的模块。在(F)和(G)中进一步扩展了装箱模块。F.来自WPC3的细胞质和线粒体核糖体的四个互连模块。显示了蛋白质的名称和每个模块的代表性功能术语。G.来自WPC3的蛋白酶体,OXPHOS和线粒体复合物IV途径的模块。 糖尿病药物基因组学分析找到新的作用靶点。上海数据库建设数据科学售后服务

    STEM基因表达趋势分析数据要求表达谱芯片或测序数据(已经过预处理)下游分析得到***富集的时间表达模式之后的分析有:1.时间表达模式中基因的功能富集2.时间表达模式中基因表达与性状之间的相关性挖掘模块的关键信息:1.找到时间表达模式中的**基因2.利用关系预测该时间表达模式功能文献1:DynamicEBF1occupancydirectssequentialepigeneticandtranscriptionaleventsinB-cellprogramming(于2018年1月发表在GenesDev.,影响因子)EBF1动态占据在B细胞中对序列表观遗传和转录过程的影响该文献采用基因表达趋势分析,探寻了EBF1诱导前后25kb转录起始位点内基因转录水平的差异,来寻找EBF1对特定功能基因的影响以及造成影响的时间节点。文献2:ComprehensivetranscriptionalprofilingofNaCl-stressedArabidopsisrootsrevealsnovelclassesofresponsivegenes(于2016年10月发表在BMCPlantBiol.,影响因子)该文献采用基因表达趋势分析,研究了高浓度盐水作用不同时间下拟南芥根的基因表达差异,来探寻在遇到高浓度盐水时拟南芥在基因层面上的应对方式。 辽宁组学实验数据科学经验丰富在基因组上同时展示突变位点和motif,为突变影响转录因子结合提供量化和可视化的证据。

    ROC机器学习受试者工作特征曲线(receiveroperatingcharacteristiccurve,简称ROC曲线),又称为感受性曲线(sensitivitycurve),是用来验证一个分类器(二分)模型的性能的。一般应用于直观展示敏感性和特异性连续变量的综合指标,如比较多个biomarker或临床参数的诊断表现、比较多个算法的分类效果。基本原理ROC曲线工作原理是,向模型中输入已知正负类的一组数据,对比模型对该组数据的预测,衡量这个模型的性能。术语解读:1、TP(TruePositive,真正,TP)被模型预测为正的正样本(原来为正预测为正)2、TN(TrueNegative,真负,TN)被模型预测为负的负样本(原来为负预测为负)3、FP(FalsePositive,假正,FP)被模型预测为正的负样本(原来为负预测为正)4、FN(FalseNegative,假负,FN)被模型预测为负的正样本(原来为正预测为负)5、真正类率(TruePostiveRate)TPR:TP/(TP+FN),**分类器预测的正类中实际正实例占所有正实例的比例。Sensitivity6、假正类率(FalsePostiveRate)FPR:FP/(FP+TN),**分类器预测的负类中预测为正实例(实际为负实例)占所有负实例的比例。1-Specificity7、真负类率(TrueNegativeRate)TNR:TN/(FP+TN)。

bubbles(不同分组的基因表达或通路富集展示):

Bubbles可以同时展示pvalue和表达量。例如展示motif的pvalue和motif对应的转录因子的表达量,方便快速看出转录因子富集且高表达所在的group,预示着该分组对细胞状态的改变(例如细胞分化、转移、应激)起关键调控作用;例如做基因功能富集分析时,展示富集的通路qvalue和基因数量或geneRatio。

基本原理:

Bubbles的实质是分组数据下基因表达量或通路内基因数量的可视化,同时可以展示pvalue。

数据要求:

表达矩阵,分组 目前能够对接超过50家实验室。

    RNAseqChIP根据RNA-seq表达谱分析得到的结果,绘制对应基因启动子区的ChIP-seq信号,观察转录因子对基因的调控影响。一般可应用场景:测了RNA-seq和ChIP-seq,结合转录因子结合情况分析基因表达;只测了RNA-seq,补充相关ChIP-seq公共数据。基本原理:染色质免疫共沉淀技术(ChromatinImmunoprecipitation,ChIP)也称结合位点分析法,是一种研究蛋白质与染色质结合情况的方法。将ChIP与第二代测序技术相结合的ChIP-Seq,能够高效地在全基因组范围内检测与组蛋白、转录因子等互作的DNA区段。转录组测序RNA-seq,获取的转录组基因表达情况,结合ChIP-seq数据,可以从更宏观的角度分析转录因子调控的对基因表达的影响。数据要求:基因列表,ChIP-seq数据。 胰腺疾病预后相关长链非编码RNA。湖北公共数据库挖掘数据科学

circos图通过圆圈和连线展示多个亚组之间的关系,包括且不限于基因、基因片段、亚型。上海数据库建设数据科学售后服务

    术语解释:互斥性(mutuallyexclusive):一组基因中只有一个在一种**中发生改变,这种现象被称为互斥性。共现性(co-occurrence):不同途径功能的基因突变可能发生在同一**中,这种现象被称为共现性。数据要求:基因突变数据下游分析:对于存在共现性或互斥性的基因对/基因集基因集的功能分析基因集相关的生存分析基于基因集的潜在靶向药物分析文献一:Functionalgenomiclandscapeofacutemyeloidleukaemia急性髓性白血病的功能基因组图(于2018年10月发表在Nature.,影响因子)文献中使用DISCOVER40方法评估531例白血病患者中**常见的复发性突变的共现性或排他性,并用点图展示。文献二:ALPK1hotspotmutationasadriverofhumanspiradenomaandspiradenocarcinoma文献中利用DISCOVER共现性质和互斥性分析工具对ALPK1和CYLD的互斥性进行了评价。 上海数据库建设数据科学售后服务

与数据科学相关的产品
与数据科学相关的**
信息来源于互联网 本站不为信息真实性负责