配置自定义词典或远程词典问题

我想新增一份自定义词典,其中关键词数量有两千多万条,由于词典的格式为"词 词性 词频",因此对这两千万条关键词进行词性标注可行吗?另外词性标注能不走分词直接进行词性标注吗?

两千多万条确实是一个非常大的数量级

如果你只是想新增自定义词典的话倒不必太多关注于词性 可设置词性为统一的n(名词)

不走分词直接进行词性标注并不是一个很好的建议,词性标注的基础就是正确的切分该单词然后根据切分单词做词性的预测,如果只想提取词性的话,可以编写逻辑代码将云端调用API方式结果集中词性数组提取出来。

感谢回复,确实我看了下 这些关键词几乎都属于名词,专门对这两千万条关键词标注词性价值不大