指代消解结果与输入tokens不一致

调用指代消解API时,传入为分句分词结果,实际指代消解的字符串和原tokens相应位置的拼接不一致。


如图中返回的结果第一个聚类的第二项**[‘SPAR20专机’, 54, 57]**,在原tokens[54:57]实际为’SPAR 20专机’,相差一个空格,结果不一致。
似乎tokens在调用指代消解API后会做类似于strip()处理,去除每个token前后的空格,但是这对于保持二者一致性造成了很大麻烦。

感谢反馈,已经改进。

1赞