企业商机
数据科学基本参数
  • 品牌
  • 云生物,数据科学
  • 服务内容
  • 软件开发,软件定制,技术开发
  • 版本类型
  • 普通版,正式版,标准版,企业版,升级版
  • 适用范围
  • 企业用户
  • 所在地
  • 上海,北京,广州
数据科学企业商机

    下游分析针对LASSO获得的基因模型(或称基因Panel)的验证:1.计算风险指数RiskScore2.绘制ROC曲线、DCA曲线、列线图进行验证3.绘制生KM存曲线对基因模型中的基因进行解释和分析:1.基因注释2.靶向药物分析应用示例:文献1:PrognosticandpredictivevalueofamicroRNAsignatureinstageIIcoloncancer:amicroRNAexpressionanalysis.于2013年12月发表在LancetOncol.,影响因子。一个miRNA特征集在stageII结肠*的预后预测作用分析文章对stageII结肠*组织和*旁正常组织的miRNA芯片数据进行了差异表达分析,并通过LASSOCox回归对获得的差异表达miRNA进行筛选,获得了6个miRNA的可以预测预后情况的miRNA特征集。文献2:PrognosticValueofaBCSC-associatedMicroRNASignatureinHormoneReceptor-PositiveHER2-NegativeBreastCancer(于2016年9月发表在EBioMedicine.上,影响因子)文章将符合条件的患者划分为训练集和测试集,首先分析获得了**干细胞相关的miRNA,接着通过LASSO对**干细胞相关的miRNA进行筛选,构建了10个miRNA的预后预测模型,并计算风险指数绘制了生存曲线和ROC曲线。 云生物提供数据科学服务。四川诊疗软件开发数据科学专业服务

    Nomogram列线图(nomogram,诺莫图)是在平面直角坐标系中,用一簇互不相交的线段表示多个临床指标或者生物学特征,用以预测一定的临床结局或者某类事件发生的概率的图。列线图使预测模型的结果更具有可读性,可个性化地计算特定**患者生存率,在临床实践中有较大的价值。一般可应用的研究方向有:将回归的结果进行可视化呈现,对个体样本给出其发病风险或比例风险;根据多个临床指标或生物学特征,判断个体样本的疾病分类或特征。基本原理:列线图的理论于1884年提出,**早用于工程学。它能够将复杂的计算公式以图形的方式,快速、直观、精确的展现出来。列线图通过构建多因素回归模型(例如Cox回归、Logistic回归等),根据模型中各个影响因素对结局变量的影响程度的高低,即回归系数的大小,给每个影响因素的每个取值水平进行赋分。将各个评分相加得到总评分,通过总评分与结局事件发生概率之间的函数转换关系,从而计算出该个体结局事件的预测概率。校准曲线(calibrationcurve)为实际发生率和预测发生率的散点图,常于用于化工行业溶液配制。在这里通过观察预测值与实际值相差情况,判断基于回归模型构建列线图的有效性。 湖北组学数据处理数据科学可对接各类公共数据库,切入各类接口,并对公共数据库进行大规模数据挖掘。

    mutationEvents**已存在的基因突变会影响其他基因的突变,突变分析时确定这些基因突变潜在的相互作用,能更好地了解健康细胞转化为*细胞的过程和机制。DISCOVER,一种针对基因突变的统计检验工具,帮助寻找***的基因突变间互斥性和共现性。一般可应用的研究场景:探索一组基因是否在**中存在互斥性和共现性;基于基因突变的互斥性和共现性,研究**发***展的潜在机制。基本原理:DISCOVER(DiscreteIndependenceStatisticControllingforObservationswithVaryingEventRates)是一种用于检测**基因组数据的共现性和互斥性的新统计检验方法。与Fisher'sexacttest等用于这些任务的传统方法不同的是,DISCOVER基于一个空模型,该模型考虑了总体**特异性的变化率,从而决定变化率的同时发生的频率是否高于或低于预期。该方法避免了共现检测中的虚假关联,提高了检测互斥性的统计能力。DISCOVER的性能与其他几个已发布的互斥性测试相比,在整个***性水平范围内,DISCOVER在控制假阳性率的同时更敏感。

    RoastROAST是一种差异表达分析方法,有助于提高统计能力、组织和解释结果以及在不同实验中的关联表达模式,一般适用于microarray、RNA-seq的表达矩阵,用limma给全部基因做差异表达分析,不需要筛差异表达基因。基本原理:ROAST是一种假设驱动的测试,对结果基因集做富集分析,富集分析考虑基因集中基因的方向性(上调或下调)和强度(log2倍变化),判断上/下调基因是否***富于集目标基因集;ROAST使用rotation,一种MonteCarlotechnology的多元回归方法,适用于样本数量较少的情况;roast检验一个geneset,对于复杂矩阵,使用mroast做multipleroasttests。富集分析结果用barcodeplot展示,使上/下调基因在目标基因集中的分布可视化。数据要求:表达矩阵。 目前能够对接超过50家实验室。

    STEM基因表达趋势分析数据要求表达谱芯片或测序数据(已经过预处理)下游分析得到***富集的时间表达模式之后的分析有:1.时间表达模式中基因的功能富集2.时间表达模式中基因表达与性状之间的相关性挖掘模块的关键信息:1.找到时间表达模式中的**基因2.利用关系预测该时间表达模式功能文献1:DynamicEBF1occupancydirectssequentialepigeneticandtranscriptionaleventsinB-cellprogramming(于2018年1月发表在GenesDev.,影响因子)EBF1动态占据在B细胞中对序列表观遗传和转录过程的影响该文献采用基因表达趋势分析,探寻了EBF1诱导前后25kb转录起始位点内基因转录水平的差异,来寻找EBF1对特定功能基因的影响以及造成影响的时间节点。文献2:ComprehensivetranscriptionalprofilingofNaCl-stressedArabidopsisrootsrevealsnovelclassesofresponsivegenes(于2016年10月发表在BMCPlantBiol.,影响因子)该文献采用基因表达趋势分析,研究了高浓度盐水作用不同时间下拟南芥根的基因表达差异,来探寻在遇到高浓度盐水时拟南芥在基因层面上的应对方式。 蛋白组代谢组个性化分析。天津算法还原与开发数据科学售后分析

做数据分析就找云生物。四川诊疗软件开发数据科学专业服务

    GeneBodyProfile(对比不同的样品在某一区域的信号特征,不**于ChIP-seq、DNase-seq、ATAC-seq数据):GeneBodyProfile表观遗传修饰和对基因表达、细胞发育等过程有着深远的影响,但相关的研究还未完善。通过对比不同的样品在某一区域的信号特征,了解不同情况下该基因的表观遗传情况,帮助更好的了解其发***展过程。一般应用场景:观察相关基因转录起始位点(TSS)、转录终止位点(TTS)、genebody以及两侧信号特征;观察某一功能区域(CpGi、TSS、TTS、peaksummits或enhancer区)及其两侧信号特征。数据要求:ChIP-seq、DNase-seq或ATAC-seq数据。下游分析:基于展示的基因或功能情况1.补充展示部分的已有相关研究2.解释展示部分对研究课题的意义。 四川诊疗软件开发数据科学专业服务

与数据科学相关的产品
与数据科学相关的**
信息来源于互联网 本站不为信息真实性负责