导图社区 Day4 2023 还能发的生信套路
Day4 2023 还能发的生信套路的思维导图,其套路:非肿瘤生信研究套路、肿瘤单基因生信研究套路、单基因泛癌生信研究套路、临床预测模型生信研究套路。
关于Day30.2 Endnote攻略的思维导图,本专业和有兴趣的朋友们不要错过,可以下载做复习。
关于Day30 双疾病双表型的思维导图,本专业和有兴趣的朋友们不要错过,可以下载做复习。
关于Day29.2 CTD数据库的思维导图,本专业和有兴趣的朋友们不要错过,可以下载做复习。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
2023 还能发的生信套路
分类
非肿瘤
难点
非肿瘤的在线分析数据库比较有限
临床信息少,一般只有表达矩阵数据
方向
单一疾病
多种疾病
需要确定研究的问题
筛到了哪些差异分子
与哪些生物学功能和通路有关
可以结合哪些表型
可能与哪些分子/药物/细胞有相关性
套路
单基因
第一类是已经确定好目标基因,仅仅需要结合疾病做相关分析
另一类则是通过基因的差异表达和预后分析取交集筛选出一个有代表性的基因
特点
满足最简配置-最简可行化框架(可实行产品)(Minimum Viable Prouduct,MVP)
一挑:癌/癌旁(配对/不配对)表达差异
看差异基因
看诊断价值
看预后价值
看临床变量因素
看变量/表型关系
看分子关联性
看分子创新性
四靠:目的基因的基线资料表、单多因素回归分析、临床相关性分析、预后分析
高可迁移性-换个疾病或者换个基因,即可批量发 SCI
上手快-零基础零代码迅速学会文章复现
兼容性强-批量低分到最高十多分生信 SCI,有潜力
基因家族
基因 signature
表型
细胞死亡模式-铁死亡(Ferroptosis)细胞焦亡(Pyroptosis)
RNA 修饰类-m1A m5C
代谢类-糖酵解(glycolysis)线粒体自噬(mitophagy) 氧化应激(Oxidative stress, OS)
单基因泛癌
要找出目标基因是否在多个癌症中都有类似的改变趋势
目标基因会和多种癌症相关联,目标基因的改变
识别出癌症的关键关节驱动因素或者跨癌症的治疗靶点
通过具体分析将结果与临床关联
基因表达分析
生存分析
通路分析
药物靶点预测
亚型分类
临床预测模型
诊断模型
预后模型
选择预测模型的构建方法
半参数化模型
COX 回归
......
非参数化模型(机器学习)
随机森林(Random Forest)是一种集成学习方法,用于解决分类和回归问题
支持向量机(Support Vector Machine,简称 SVM)是一种在分 类和回归问题上都很有效的监督学习方法
LASSO 回归(Least Absolute Shrinkage and Selection Operator Regression)
对模型进行评价
外部验证集
临床有效性
受试者工作曲线(Receiver Operating Characteristic Curve,简称 ROC 曲线)
ROC 曲线下的面积(Area Under the ROC Curve,简称AUC)
ceRNA(competing endogenous RNAs,内源竞争 RNA)
ceRNA 的核心研究模式
mRNA-miRNA-lncRNA 构建互作网络
mRNA-miRNA-circRNA 构建互作网络
多主角模式-多主角模式
单分子主角模式
特定表型
四条规律
肿瘤非肿瘤都适用,但是只有肿瘤类有临床预后分析
只要这个表型发过基础研究相关的文章,我们就可以把这个表型拿过来做生信相关的课题
只要表型能与疾病搭上线可以做,换一个表型或者换一个疾病就可以成为一个创新点
筛选表型的算法不一样
疾病亚型、分组不一样
数据集不一样
分子类型不一样
组学的组成类型不一样
课题设计分析的逻辑不一样
机器学习
细胞外基质(ExtraCellular Matrix,ECM)
亮点
使用 M3C 进行基因分类和样本分型,给出更加明确的分组依据
使用机器学习算法对不同数据集训练和验证对数据进行诊断、预后和免疫治疗分析
多种算法组合确定免疫状态
聚焦单个癌种的一区代表作,可分析多种热点表型
结合 Nature 数据库,通过新方法重新定义了受体-配体对之间的关系,探索下游靶点
紧跟临床应用与免疫治疗热点,具有临床转化价值
多组学
常见类型
基因组
转录组
蛋白质组
代谢组
注意事项
在数据收集时确保这些数据集涵盖了相同样本或研究对象的不同层面的信息。
在数据整合时确保样本之间的对应关系正确,以确保后续分析的准确性
要选择合适的数据分析方法
单细胞泛癌
六个方向
肿瘤细胞异质性
肿瘤微环境
肿瘤免疫反应
肿瘤耐药性
肿瘤干细胞分化
肿瘤进化演变
作用
理解癌症的异质性特点以及不同细胞亚群在癌症发展和治疗中的作用
分析转移性肿瘤细胞与原发肿瘤细胞之间的差异,揭示转移的关键分子标记物和 途径
揭示肿瘤细胞对药物的抵抗机制,为寻找克服药物抵抗性的策略提供线索
了解肿瘤免疫逃逸机制和开发免疫治疗策略
单细胞
常见应用方向
大规模细胞图谱构建
细胞亚群细化和稀有细胞类型鉴定
生物标志物/疾病分型
免疫方向
与肿瘤,干细胞发育和分化,神经科学和发育生物学的研究
与空间转录组联合分析是
两类细胞亚群在单细胞和空转的交互分析
3 种细胞空间共定位分析+3 大算法细胞通讯分析
细胞类型+细胞特异性在空间转录组的测试集+验证集联合分析
孟德尔随机化
应用范围
行为因素与健康:基因变异引起各个倾向某行为,决定暴露状态
机体代谢产物(内暴露)与疾病关系,估计长期效应
评估药物等治疗手段对疾病的影响
研究环境暴露因素对健康的影响
研究心理对健康的影响
NHANES 数据库挖掘
四大机器学习算法
Logistic
支持向量机(Support Vector Machine,SVM)
随机森林(Random Forest,RF)
XGBoost(eXtreme Gradient Boosting)
不同分数段的文章套路类型
从数据集来判定
以测试集+验证集是提分的最基础手段
其次是分析方法
差异表达分析+富集分析+互作网络分析+免疫浸润或者临床相关性分析
在高分内容当中,会在这些最基础的内容上增加更多的分析内容
最后是有没有创新和热点
生信研究套路的创新性
梳理盲区
专业盲区-纵向思维:确认所研究的疾病有哪些表型
模式盲区-横向思维:确认表型研究的框架模式和模式的共性以及常规分析方法
能力盲区-内部能力:确认自己学会了图表分析,如何用零代码或者 R 语 言的方式分析结果
起底素材库
表型报道
有哪些表型报道?
相关基因
有哪些基因?
套路汇总
中有哪些相关的生信文章发表?
数据集信息汇总
有哪些可以使用的数据集?
高分热点
有哪些高分文章发表?
研究的热点在哪里?
思路借鉴
有哪些高分热点文章?
路是否适用于自己的研究?
概述
总结
建立文献筛选模型
批量做加法
专业做减法
非肿瘤生信研究套路
肿瘤单基因生信研究套路
单基因泛癌生信研究套路
临床预测模型生信研究套路
四个问题
理解本质
课题拆解
提炼重点
高效验证