Institutional Repository of Peking University: 基于模型融合方法的中文疾病问答文本匹配方法研究 - 开云app体育

Title	基于模型融合方法的中文疾病问答文本匹配方法研究
Other Titles	Research on Chinese Disease Question Answering Text Matching Method Based on Model Ensemble Method
Authors	吴梓明杨芳宇梁俊雷健波
Affiliation	华南理工大学首都医科大学护理学院浙江大学医学院附属第二医院信息科开云app体育医学信息学中心
Keywords	文本匹配特征工程提升树模型 BERT text matching feature engineering boosting tree model BERT
Issue Date	20-Feb-2023
Publisher	中国卫生信息管理杂志
Abstract	目的中文疾病问答系统中的文本匹配由于中文医学用语的特殊性而存在诸多挑战，本研究旨在探索更好解决中文疾病问答系统中文本匹配的机器学习方法。方法提出了一种基于BERT与提升树模型的模型融合方法，并利用CHIP2019疾病问答迁移学习评测任务中提供的数据集进行验证。结果此方法在评测数据集上比其他BERT衍生模型表现更优，评测指标Macro F1值达到0.90825。同时，实验表明此方法与BERT模型相比在效果上提升了3.83%。结论本研究所提出的模型融合方法可以有效地提升单个模型的性能，在疾病问答迁移学习评测任务中取得了良好的效果。目的中文疾病问答系统中的文本匹配由于中文医学用语的特殊性而存在诸多挑战，本研究旨在探索更好解决中文疾病问答系统中文本匹配的机器学习方法。方法提出了一种基于BERT与提升树模型的模型融合方法，并利用CHIP2019疾病问答迁移学习评测任务中提供的数据集进行验证。结果此方法在评测数据集上比其他BERT衍生模型表现更优，评测指标Macro F1值达到0.90825。同时，实验表明此方法与BERT模型相比在效果上提升了3.83%。结论本研究所提出的模型融合方法可以有效地提升单个模型的性能，在疾病问答迁移学习评测任务中取得了良好的效果。
URI	http://hdl.handle.net/20.500.11897/671445
ISSN	1672-5166
Appears in Collections:	医学信息中心

Files in This Work

There are no files associated with this item.

Web of Science®

0

Checked on Last Week

百度学术™

0

Checked on Current Time

Show full item record

License: See PKU IR operational policies.