在使用贝叶斯分类器进行文本分类时,训练后出现如下结果,最终只选中了1个特征,在预测中,所有的新语料的预测结果都是同一个分类,出现这种情况的原因是什么呢?
耗时 792 ms 加载了 6 个类目,共 1111 篇文档
原始数据集大小:1111
使用卡方检测选择特征中…耗时 1 ms,选中特征数:1 / 19 = 5.26%
贝叶斯统计结束
在使用贝叶斯分类器进行文本分类时,训练后出现如下结果,最终只选中了1个特征,在预测中,所有的新语料的预测结果都是同一个分类,出现这种情况的原因是什么呢?
耗时 792 ms 加载了 6 个类目,共 1111 篇文档
原始数据集大小:1111
使用卡方检测选择特征中…耗时 1 ms,选中特征数:1 / 19 = 5.26%
贝叶斯统计结束
您的文本文件目录是在同一个文件夹下还是分级文件夹?
跟搜狗语料库的那个例子类似,就是在一个文件夹中,有六个文件夹,每个文件夹中都对应类别的语料
是因为语料的数量太小了吗?或者是类别间的数据量过于悬殊?还是说每个语料的文字量太少