基于文本挖掘的药物副作用知识发现研究

范馨月崔雷 · 2018

阅读量：238

药物副作用

文本挖掘

命名实体识别

聚类分析

期刊名称：

数据分析与知识发现 2018 年 03 期

摘要：

【目的】利用文本挖掘方法发现潜在的药物–副作用关系,为完善现有药物–副作用数据库及药物副作用早期预测提供有效途径。【方法】从PubMed数据库获取2011年–2016年间与人类药物治疗和副作用相关文献共100 873篇,对文献集进行Perl语言切分处理、基于词典的命名实体识别、R语言生成药物–副作用共现矩阵、gCLUTO双聚类分析等一系列研究。【结果】以聚类结果中一类为例,计算得到本方法提取药物–副作用的准确率达75.65%,其中发现潜在的药物–副作用关系比例达13.91%。【局限】仅使用基于词典的...