HanLP中的模型都是用深度学习训练出来的吗?

因为从《自然语言处理入门》这本书进来的,书上的例子基本都是使用非深度学习的传统机器学习方法,所以好奇想看一下相关的语言处理代码。
还有个地方也挺好奇的。就是HanLP中使用的深度学习框架是什么呢?RNN、CNN、LSTM、Attention、Transform之类的拼接吗?以及每个任务的网络架构是不是也不同呢。
以上都是自己的一些好奇,想琢磨一下后面的学习方向,如果能稍微提点一下也不胜感谢 :heart:

1赞

基本的砖块(building block)的确包括这些,当然也包括biaffine、CRF等等。

一个任务可以通过多种模型驱动,一个模型也可以驱动多种任务。多任务学习可以把多个任务糅合进一个模型,蒸馏也可以用多个模型提高同一个任务。

如果把NLP比作建筑,这些砖块都是皮毛功夫,学起来很快但是学会了也就是个搬砖的水平。语言学、概率图模型和机器学习中的一些优化理论才是精髓。

建议从你感兴趣的任务切入,对照代码阅读HanLP文档中相应的论文:https://hanlp.hankcs.com/docs/api/hanlp/pretrained/index.html

1赞