tok = hanlp.load(hanlp.pretrained.tok.CTB9_TOK_ELECTRA_SMALL)
[‘请问’, ‘客服’, ‘系统’, ‘的’, ‘价格’, ‘是’, ‘多少’, ‘?’, ‘有没有’, ‘什么’, ‘优惠’, ‘呢’, ‘?’]
1赞
- 正常。原理跟Transformer有关,两段代码Transformer的输入并不相同。
- tok模型的输入本来就应当是单句。未分句的文本与训练数据不匹配。
- “有没有”这个具体的案例,原因也包括CTB9标注数据中存在的不一致。建议使用
FINE_ELECTRA_SMALL_ZH
。
2赞
好的,非常感谢,我主要在研究NER的功能,切词9个模型,NER4个模型,都运行了一下,觉得COARSE_ELECTRA_SMALL_ZH / MSRA_NER_ELECTRA_SMALL_ZH 这个组合的效果是最好的。
2赞