Title 基于模型融合方法的中文疾病问答文本匹配方法研究
Other Titles Research on Chinese Disease Question Answering Text Matching Method Based on Model Ensemble Method
Authors 吴梓明
杨芳宇
梁俊
雷健波
Affiliation 华南理工大学
首都医科大学护理学院
浙江大学医学院附属第二医院信息科
开云app体育 医学信息学中心
Keywords 文本匹配
特征工程
提升树模型
BERT
text matching
feature engineering
boosting tree model
BERT
Issue Date 20-Feb-2023
Publisher 中国卫生信息管理杂志
Abstract 目的 中文疾病问答系统中的文本匹配由于中文医学用语的特殊性而存在诸多挑战,本研究旨在探索更好解决中文疾病问答系统中文本匹配的机器学习方法。方法 提出了一种基于BERT与提升树模型的模型融合方法,并利用CHIP2019疾病问答迁移学习评测任务中提供的数据集进行验证。结果 此方法在评测数据集上比其他BERT衍生模型表现更优,评测指标Macro F1值达到0.90825。同时,实验表明此方法与BERT模型相比在效果上提升了3.83%。结论 本研究所提出的模型融合方法可以有效地提升单个模型的性能,在疾病问答迁移学习评测任务中取得了良好的效果。
目的 中文疾病问答系统中的文本匹配由于中文医学用语的特殊性而存在诸多挑战,本研究旨在探索更好解决中文疾病问答系统中文本匹配的机器学习方法。方法 提出了一种基于BERT与提升树模型的模型融合方法,并利用CHIP2019疾病问答迁移学习评测任务中提供的数据集进行验证。结果 此方法在评测数据集上比其他BERT衍生模型表现更优,评测指标Macro F1值达到0.90825。同时,实验表明此方法与BERT模型相比在效果上提升了3.83%。结论 本研究所提出的模型融合方法可以有效地提升单个模型的性能,在疾病问答迁移学习评测任务中取得了良好的效果。
URI http://hdl.handle.net/20.500.11897/671445
ISSN 1672-5166
Appears in Collections: 医学信息中心

Files in This Work
There are no files associated with this item.

Web of Science®


0

Checked on Last Week

百度学术™


0

Checked on Current Time




License: See PKU IR operational policies.