tok.dict_force = {‘公司ID’}
print(f’强制模式:\n{HanLP(“公司ID”)[“tok/fine”]}’) # 慎用,详见《自然语言处理入门》第二章
!!! force 之后仍然切词成2个词,“公司” 和 “ID” !!!
tok.dict_force = {‘公司ID’}
print(f’强制模式:\n{HanLP(“公司ID”)[“tok/fine”]}’) # 慎用,详见《自然语言处理入门》第二章
!!! force 之后仍然切词成2个词,“公司” 和 “ID” !!!
但是 “卡拉OK” 却可以。这个是怎么强制设置的?
牛B 也是不能切词成功的