HanLP中的依存句法分析功能是基于哪些知识点得到的

最近开始写论文了,我的论文中用到HanLP这个工具库的依存句法分析功能,但是不清楚这个功能是基于哪些知识点得到的

句法分析涉及的知识点较多。
可浏览
Dependency Parsing — HanLP documentation 或者
句法分析-码农场 进行了解。


  • 依存句法理论

依存语法理论认为词与词之间存在主从关系,这是一种二元不等价的关系。在句子中,如果一个词修饰另一个词,则称修饰词为从属词( dependent ),被修饰的词语称为支配词(head),两者之间的语法关系称为依存关系( dependency relation)。比如句子“大梦想”中形容词“大”与名词“梦想”之间的依存关系如图所示:

image
图中的箭头方向由支配词指向从属词,这是可视化时的习惯。将一个句子中所有词语的依存关系以有向边的形式表示出来,就会得到一棵树,称为依存句法树 ( dependency parse tree)。比如句子“弱小的我也有大梦想”的依存句法树如图所示。


以上是对Dependency Parsing的简单介绍。依存分析,并不是我们NLP中最常见 的任务之一,我们也很少看到直接将依存分析做应用的,我们更常见的是分类、实体识别、 阅读理解、对话等任务。但是依存分析,作为自然语言处理的一项基础技术,试图让机器去 理解语言的内部结构,理解了结构,NLU(Natural Language Understanding)才成为可能。更多请搜索相关知识进行详细了解。

依存句法分析是语言学中讨论较为深入的一个话题。兼顾语言学理论和计算可实现性的综述与专著推荐两份,
一篇综述是 de Marneffe, M.-C., & Nivre, J. (2019). Dependency Grammar. Annual Review of Linguistics, 5(1), 197–218. https://doi.org/10.1146/annurev-linguistics-011718-011842
专著是刘海涛所著的《依存语法的理论与实践》 依存语法的理论与实践 (豆瓣) (douban.com)

1赞