在利用sts来进行语义相似度分析的时候,发现这么一种情况,如果两个语句本身完全没有任何关系,但是同时加上否定之后,相似度很高。举个例子:[‘委托填报选计划’,‘公告定稿’] 这一对的相似度,是0;但是都加上否定词汇,变成[‘委托填报选不到计划’,‘公告无法定稿’] 这样的一堆,相似度变成了0.9639711380004883 。
这种情况,会是什么原因导致的,要怎么避免掉或者说是纠正掉?
对于特定语料需要单独训练模型可能会解决目前所遇到的问题。
在利用sts来进行语义相似度分析的时候,发现这么一种情况,如果两个语句本身完全没有任何关系,但是同时加上否定之后,相似度很高。举个例子:[‘委托填报选计划’,‘公告定稿’] 这一对的相似度,是0;但是都加上否定词汇,变成[‘委托填报选不到计划’,‘公告无法定稿’] 这样的一堆,相似度变成了0.9639711380004883 。
这种情况,会是什么原因导致的,要怎么避免掉或者说是纠正掉?
对于特定语料需要单独训练模型可能会解决目前所遇到的问题。