已知:给定一个二分类的中文短信数据集,已知标签为1:垃圾短信,0:非垃圾短信
需求:根据观察短信数据集,假设能分成娱乐、财经、房产、金融、体育、社会等10个类别
问题:存在哪些方法能完成多分类的标签标注?
比如有哪些无监督或者有监督方法。
- 短信内容标签:娱乐、财经、房产、金融、体育、社会等10个类别和 【垃圾短信、非垃圾短信】有关联关系吗?
- 多分类可以先标注好带标签的短信作训练语料,输入模型进行训练。
- 确认下场景多分类需求是单标签,还是允许多标签存在?
已知:给定一个二分类的中文短信数据集,已知标签为1:垃圾短信,0:非垃圾短信
需求:根据观察短信数据集,假设能分成娱乐、财经、房产、金融、体育、社会等10个类别
问题:存在哪些方法能完成多分类的标签标注?
比如有哪些无监督或者有监督方法。