企业商机
数据科学基本参数
  • 品牌
  • 云生物,数据科学
  • 服务内容
  • 软件开发,软件定制,技术开发
  • 版本类型
  • 普通版,正式版,标准版,企业版,升级版
  • 适用范围
  • 企业用户
  • 所在地
  • 上海,北京,广州
数据科学企业商机

    RoastROAST是一种差异表达分析方法,有助于提高统计能力、组织和解释结果以及在不同实验中的关联表达模式,一般适用于microarray、RNA-seq的表达矩阵,用limma给全部基因做差异表达分析,不需要筛差异表达基因。基本原理:ROAST是一种假设驱动的测试,对结果基因集做富集分析,富集分析考虑基因集中基因的方向性(上调或下调)和强度(log2倍变化),判断上/下调基因是否***富于集目标基因集;ROAST使用rotation,一种MonteCarlotechnology的多元回归方法,适用于样本数量较少的情况;roast检验一个geneset,对于复杂矩阵,使用mroast做multipleroasttests。富集分析结果用barcodeplot展示,使上/下调基因在目标基因集中的分布可视化。数据要求:表达矩阵。 云生物立足于上海,提供相关数据科研咨询与服务。上海组学实验数据科学

    蛋白质主要由碳、氢、氧、氮等化学元素组成,是一类重要的生物大分子。蛋白质的功能由蛋白质的三维结构决定。蛋白质三维结构绘图,可以直观地展示蛋白质三维功能结构,广泛应用于单核苷酸突变功能分析、药物蛋白分子相互作用分析等研究领域。基本原理蛋白质三维结构绘图主要分为蛋白质三维结构预测以及对结构进行可视化两步。蛋白质三维结构预测是基于蛋白质中氨基酸序列预测蛋白质折叠结构的步骤,**常用的预测方法为同源建模,同源建模的原理是序列相似的蛋白质具有相似的蛋白质结构,要推测一个未知结构蛋白的三维结构,只需要找到与之序列高度相似的已知结构模板。在无法进行同源建模(找不到模型)的情况下,还有折叠识别及从头建模法,但是计算量大运行缓慢且建模准确度不如同源建模。获得蛋白质三维结构预测的pbd文件后还需要通过分子三维结构软件绘制可视化的三维图,并分析特殊位点(分子对接或突变位点分析),常用的有pymol和DeepView等。数据要求目标蛋白的氨基酸序列或者编码蛋白的基因序列,突变数据等。下游分析突变位点靶向药物分析等。 四川公共数据库挖掘数据科学我们团队具备完整的数据分析、数据库构建、软件开发团队。

    下游分析针对LASSO获得的基因模型(或称基因Panel)的验证:1.计算风险指数RiskScore2.绘制ROC曲线、DCA曲线、列线图进行验证3.绘制生KM存曲线对基因模型中的基因进行解释和分析:1.基因注释2.靶向药物分析应用示例:文献1:PrognosticandpredictivevalueofamicroRNAsignatureinstageIIcoloncancer:amicroRNAexpressionanalysis.于2013年12月发表在LancetOncol.,影响因子。一个miRNA特征集在stageII结肠*的预后预测作用分析文章对stageII结肠*组织和*旁正常组织的miRNA芯片数据进行了差异表达分析,并通过LASSOCox回归对获得的差异表达miRNA进行筛选,获得了6个miRNA的可以预测预后情况的miRNA特征集。文献2:PrognosticValueofaBCSC-associatedMicroRNASignatureinHormoneReceptor-PositiveHER2-NegativeBreastCancer(于2016年9月发表在EBioMedicine.上,影响因子)文章将符合条件的患者划分为训练集和测试集,首先分析获得了**干细胞相关的miRNA,接着通过LASSO对**干细胞相关的miRNA进行筛选,构建了10个miRNA的预后预测模型,并计算风险指数绘制了生存曲线和ROC曲线。

    GSEA数据要求1、通常为表达谱芯片或测序数据(已经过预处理),也可以是其他形式可排序的基因数据。2、具有已知生物学意义(GO、Pathway、**特征基因集等)的基因集。下游分析:得到GSEA结果之后的分析有:1.基因注释:1、绘制基因集富集趋势图(Enrichmentplot)横坐标:按差异表达差异排序的基因序列。数值越小(偏向左端)的基因**在shICAM-1组中有越高倍数的差异表达,数值越小(偏向右端)的基因在对照组中有越高倍数的差异表达。纵坐标:上方的纵坐标为富集打分ES,ES是一个动态的值,沿着基因序列,找到条目中的基因则增加评分,否则减少评分。通常用偏离0**远的值作为**终富集打分。下方的纵坐标**基因表达与表型的关联,***值越大**关联越强,数值大于0**正相关,小于0则**负相关。 做数据分析就找云生物。

genomeview(基因浏览图):genomeView是对基因组的可视化,可以直观展示RNA-seq和ChIP-seq的信号,证实转录因子结合对基因转录的影响等等。

数据要求:RNA-seq和ChIP-seq等数据。应用示例:文献1:Genomic landscape and evolution of metastatic chromophobe renal cell carcinoma.(于2017年6月发表在JCI Insight.,影响因子6.041)。本文对转移性肾嫌色细胞*进行了系统的基因组研究,文中绘制基因流览图对整个基因组数据进行了可视化。转移性肾嫌色细胞*的基因组景观和演化。 采用机器学习算法对疾病的干性指数进行分型分类研究。四川数据库建设数据科学经验丰富

指导科研方案纠偏,更好更快发表文章。上海组学实验数据科学

    单细胞测序数据挖掘:GEO目前收录的单细胞研究样本已经超过2万例,单细胞测序几乎成为生物医学领域CNS***文章的标配。实验费用高昂,阻断了CNS梦,既然其他数据可以挖,单细胞测序数据照样可以挖。已知公共数据库中单细胞测序数据涉及各种疾病类型,包括**、免疫细胞、炎症类甚至神经、肌肉、骨骼等,样本丰富、数据庞大,你不挖就是失去了一座金山。我们提供各种设计单细胞测序、各种测序、芯片、多组学的公共数据库挖掘、培训、模型构建、临床统计、算法还原服务;你能想到,我能做到;你提供参考文献、思路和目的,我们提供结果;如果没有思路,我们提供付费科研设计服务。示例如下:利用公共数据库的1539个单细胞样本,构建自己的生物学故事。 上海组学实验数据科学

与数据科学相关的产品
与数据科学相关的**
信息来源于互联网 本站不为信息真实性负责