HanLP中的模型都是用深度学习训练出来的吗？

wispytrace · 2022年04月24日 05:25

因为从《自然语言处理入门》这本书进来的，书上的例子基本都是使用非深度学习的传统机器学习方法，所以好奇想看一下相关的语言处理代码。
还有个地方也挺好奇的。就是HanLP中使用的深度学习框架是什么呢？RNN、CNN、LSTM、Attention、Transform之类的拼接吗？以及每个任务的网络架构是不是也不同呢。
以上都是自己的一些好奇，想琢磨一下后面的学习方向，如果能稍微提点一下也不胜感谢

hanlpbot · 2022年04月24日 16:13

基本的砖块（building block）的确包括这些，当然也包括biaffine、CRF等等。

一个任务可以通过多种模型驱动，一个模型也可以驱动多种任务。多任务学习可以把多个任务糅合进一个模型，蒸馏也可以用多个模型提高同一个任务。

如果把NLP比作建筑，这些砖块都是皮毛功夫，学起来很快但是学会了也就是个搬砖的水平。语言学、概率图模型和机器学习中的一些优化理论才是精髓。

建议从你感兴趣的任务切入，对照代码阅读HanLP文档中相应的论文：https://hanlp.hankcs.com/docs/api/hanlp/pretrained/index.html