摘要:
【目的】利用文本挖掘方法发现潜在的药物–副作用关系,为完善现有药物–副作用数据库及药物副作用早期预测提供有效途径。【方法】从PubMed数据库获取2011年–2016年间与人类药物治疗和副作用相关文献共100 873篇,对文献集进行Perl语言切分处理、基于词典的命名实体识别、R语言生成药物–副作用共现矩阵、gCLUTO双聚类分析等一系列研究。【结果】以聚类结果中一类为例,计算得到本方法提取药物–副作用的准确率达75.65%,其中发现潜在的药物–副作用关系比例达13.91%。【局限】仅使用基于词典的...