感知机算法

你好,我在使用感知机算法进行姓名性别识别时,发现报错,具体是什么原因可以帮我看下吗?

是不是我的语料库问题。语料库里就加了几个名字。如下图。image


姓名识别.txt中语料格式与demo语料格式不一致。正确格式如下:

余桃女,女
陈晓飞,男
何惜池,女

在PerceptronClassifier.java中会以 (,逗号)分割 生成string类型数组,cells[0]:姓名、cells[1]:性别
你的姓名识别.txt中无性别,只有cells[0] ,在运行cells[1]时产生数组越界问题。
建议按照demo语料格式进行学习、训练。

那如果测试文档中标明了性别,那这样答案都给出来了,还用去识别有什么意义呢

在你的demo程序中,train语料与test语料使用的是同一个TESTING_SET
正常是train(TRAIN_SET) 训练集标注姓名 + 性别
test(TEST_SET) 测试集只包含姓名, 预测值为性别