不支持中英文切词

tok.dict_force = {‘公司ID’}

print(f’强制模式:\n{HanLP(“公司ID”)[“tok/fine”]}’) # 慎用,详见《自然语言处理入门》第二章

!!! force 之后仍然切词成2个词,“公司” 和 “ID” !!!

但是 “卡拉OK” 却可以。这个是怎么强制设置的?

牛B 也是不能切词成功的

大小写问题:https://colab.research.google.com/drive/1EXL7ajUnG3eI9-zfZHXynCALuUnZH9UQ?usp=sharing

https://github.com/hankcs/HanLP/commit/e7eb64b05b664f011cd452816ddade176dcfbb9b