Title | 基于模型融合方法的中文疾病问答文本匹配方法研究 |
Other Titles | Research on Chinese Disease Question Answering Text Matching Method Based on Model Ensemble Method |
Authors | 吴梓明 杨芳宇 梁俊 雷健波 |
Affiliation | 华南理工大学 首都医科大学护理学院 浙江大学医学院附属第二医院信息科 开云app体育 医学信息学中心 |
Keywords | 文本匹配 特征工程 提升树模型 BERT text matching feature engineering boosting tree model BERT |
Issue Date | 20-Feb-2023 |
Publisher | 中国卫生信息管理杂志 |
Abstract | 目的 中文疾病问答系统中的文本匹配由于中文医学用语的特殊性而存在诸多挑战,本研究旨在探索更好解决中文疾病问答系统中文本匹配的机器学习方法。方法 提出了一种基于BERT与提升树模型的模型融合方法,并利用CHIP2019疾病问答迁移学习评测任务中提供的数据集进行验证。结果 此方法在评测数据集上比其他BERT衍生模型表现更优,评测指标Macro F1值达到0.90825。同时,实验表明此方法与BERT模型相比在效果上提升了3.83%。结论 本研究所提出的模型融合方法可以有效地提升单个模型的性能,在疾病问答迁移学习评测任务中取得了良好的效果。 目的 中文疾病问答系统中的文本匹配由于中文医学用语的特殊性而存在诸多挑战,本研究旨在探索更好解决中文疾病问答系统中文本匹配的机器学习方法。方法 提出了一种基于BERT与提升树模型的模型融合方法,并利用CHIP2019疾病问答迁移学习评测任务中提供的数据集进行验证。结果 此方法在评测数据集上比其他BERT衍生模型表现更优,评测指标Macro F1值达到0.90825。同时,实验表明此方法与BERT模型相比在效果上提升了3.83%。结论 本研究所提出的模型融合方法可以有效地提升单个模型的性能,在疾病问答迁移学习评测任务中取得了良好的效果。 |
URI | http://hdl.handle.net/20.500.11897/671445 |
ISSN | 1672-5166 |
Appears in Collections: | 医学信息中心 |