中文电子病历命名实体识别的主动学习方法研究

大小: 3.51MB

文件类型: .caj

金币: 1

下载: 0 次

发布日期: 2023-11-07
语言: 其他
标签: 电子病例 主动学习

高速下载

资源简介

主动学习通过选择现有模型中未充分训练的数据进行迭代训练,从而利用少量标注数据训练出较高性能的模型。传统的主动学习方法只关注数据本身的信息量而忽略了该数据是否孤立。论文提出一种改进的主动学习方法,利用相似病历中出现的词汇往往雷同的特点,以文档中文字的分布衡量其在样本集的普遍程度,并以此对信息量进行加权。而后实现该方法,并进行了与消极学习和传统主动学习方法的对比实验。结果表明,该方法相对消极学习与传统的主动学习方法, 效果有明显提升,能够减少对标注数据的需求。

资源截图

小图大图

代码片段和文件信息

共有条评论

中文电子病历命名实体识别的主动学习方法研究

资源简介

资源截图

代码片段和文件信息

评论

相关资源