术语解释:互斥性(mutuallyexclusive):一组基因中只有一个在一种**中发生改变,这种现象被称为互斥性。共现性(co-occurrence):不同途径功能的基因突变可能发生在同一**中,这种现象被称为共现性。数据要求:基因突变数据下游分析:对于存在共现性或互斥性的基因对/基因集基因集的功能分析基因集相关的生存分析基于基因集的潜在靶向药物分析文献一:Functionalgenomiclandscapeofacutemyeloidleukaemia急性髓性白血病的功能基因组图(于2018年10月发表在Nature.,影响因子)文献中使用DISCOVER40方法评估531例白血病患者中**常见的复发性突变的共现性或排他性,并用点图展示。文献二:ALPK1hotspotmutationasadriverofhumanspiradenomaandspiradenocarcinoma文献中利用DISCOVER共现性质和互斥性分析工具对ALPK1和CYLD的互斥性进行了评价。 采用机器学习算法对疾病的干性指数进行分型分类研究。山东临床统计数据科学欢迎咨询
Lasso术语解读λ(Lambda):复杂度调整惩罚值,λ越大对变量较多的线性模型的惩罚力度就越大,**终获得的变量越少。是指在所有的λ值中,得到**小目标参量均值的那一个。而是指在一个方差范围内得到**简单模型的那一个λ值。交叉验证(crossvalidation):交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某样本在下次可能成为测试集中的样本,即所谓“交叉”。数据要求:1、表达谱芯片或测序数据(已经过预处理)或突变数据2、包含生存状态和生存时间的预后数据或者其它临床分组数据。 重庆数据科学活动承担各类项目超过400余项。
immune-network免疫网络**微环境(TME)是**周围的环境,包括周围血管,免疫细胞,成纤维细胞,信号分子和细胞外基质(ECM)。**与周围微环境密切相关,不断相互作用。**可以通过释放细胞外信号,促进**血管生成和诱导外周免疫耐受来影响微环境,而微环境中的免疫细胞可以影响*细胞的生长和进化。免疫细胞泛指所有参与免疫反应的细胞,也特指能识别抗原,产生特异性免疫应答的淋巴细胞等。主要包括T淋巴细胞、B淋巴细胞、单核细胞、巨噬细胞、粒细胞、肥大细胞、辅佐细胞,以及它们的前体细胞等,是免疫系统的功能单元。**微环境中免疫细胞之间相互作用形成免疫网络,网络设立可以清晰了解**微环境中免疫细胞之间的影响机制。应用场景用网络图同时展示相关关系、pvalue、聚类/分类结果、跟预后的关系。-例如例文中各细胞之间的相关关系、跟预后的关系。基本原理:免疫系统遍布全身,涉及多种细胞、***、蛋白质和组织。它可以区分我们的组织和外来组织自我和非自我。死亡和有缺陷的细胞也会被免疫系统识别和***。如果免疫系统遇到病原体就会产生免疫反应。免疫细胞泛指所有参与免疫反应的细胞,也特指能识别抗原,产生特异性免疫应答的淋巴细胞等。
术语解读
数据降维:
降维就是一种对高维度特征数据预处理方法。降维是将高维度的数据保留下**重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。在实际的生产和应用中,降维在一定的信息损失范围内,可以为我们节省大量的时间和成本。降维也成为应用非常***的数据预处理方法。
数据要求:
表达谱芯片或测序数据(已经过预处理)
下游分析
得到PCA分析结果之后的分析有:
1.对组成主要成分的基因进行后续分析,探究该情况下关键基因表达情况
2.对组成不同主成分簇的基因进行后续分析,探究该情况下不同基因集的表达情况 调控区域ChiP-seq信号分布图。
GeneBodyProfile(对比不同的样品在某一区域的信号特征,不**于ChIP-seq、DNase-seq、ATAC-seq数据):GeneBodyProfile表观遗传修饰和对基因表达、细胞发育等过程有着深远的影响,但相关的研究还未完善。通过对比不同的样品在某一区域的信号特征,了解不同情况下该基因的表观遗传情况,帮助更好的了解其发***展过程。一般应用场景:观察相关基因转录起始位点(TSS)、转录终止位点(TTS)、genebody以及两侧信号特征;观察某一功能区域(CpGi、TSS、TTS、peaksummits或enhancer区)及其两侧信号特征。数据要求:ChIP-seq、DNase-seq或ATAC-seq数据。下游分析:基于展示的基因或功能情况1.补充展示部分的已有相关研究2.解释展示部分对研究课题的意义。 检测服务及数据分析助力取得2020年国自然面上十项、青年基金十八项。广东组学实验数据科学共同合作
早期肝疾病的预后基因panel研究。山东临床统计数据科学欢迎咨询
**初目的:对手上的**样本(或病人)进行分型分析,期望找到不同的亚型,并对应不同的临床特征。可扩展应用到:所有样本的亚型分析,用于样本的特征分析。数据可用转录组、基因组、甲基化、蛋白质组等。输入数据格式:一个数值矩阵,行是基因或者其他特征,列是样本。本分析要求样本数要多,有利于亚型的分析。参考文献:(2)::本文利用室管膜瘤病人的甲基化数据,首先进行了tSNE分型,随后又采用了新的方法spectralclustering进行分类分析,作者比较了两种分类方法。使用spectralclustering的分类,鉴定了每一种**亚型的特异性表达模式。并且发现spectralclustering的分类和病人的临床特征有关,从而提出一种新的室管膜瘤亚型,可用于临床的筛选和检测。 山东临床统计数据科学欢迎咨询