您的当前位置:首页 >> 期刊文献 >> 正文
基于XGBoost的中文网络评论分类方法研究
摘 要:
针对目前国内网络环境,网民数量和网络论坛的评论数量都出现了快速增长。然而,评论分类算法仍有很大的发展空间。本研究充分利用爬虫获取网络论坛的评论文本,然后利用基于XGBoost的方法对评论文本进行分类。通过对24000个文本和11个文本类别的数据集进行训练,测试数据集的准确率为93.13%,F1为93.12%,召回率为93.14%。XGBoost的精度远远高于随机森林、物流回归、朴素贝叶斯。结果表明,XGBoost方法能够更准确地对大量评论文本进行分类。
作 者:
  • 刘思聪;卢甘霖;崔子良;尹建烁
单 位:
    西北农林科技大学信息工程学院
关键字:
  • 评论文本;文本分类;机器学习;XGBoost;
页 码:
    226-227
出 处:
HTML阅读PDF文献下载您还没有登陆会员账号,请先登陆,在进行阅读或下载!
返回顶部 关注公众号