有没有demo
请具体描述,事件处理是指业务场景还是程序环境?
业务场景,比如下载的新闻,要从里面抽出人物(出访人,受访人,陪同人),时间,地点,主题,发言
从描述事件信息的文本中识别并抽取出事件信息并以结构化的形式呈现,包括发生的时间、地点、参与角色、以及相互之间动作和状态的改变。
该任务属于新闻事件识别和抽取,可利用hanlp命名实体识别、句法分析、语义分析等技术对需要识别的文本进行基础性处理。
自然语义公司将于北京时间1月28日上午10点举行产品发布会,这一次产品发布会的地点是全新建设的青岛大剧院,根据目前的消息,这次发布会上CTO赵毅将会发布大数据搜索引擎、文本转换、语音识别等前沿的软件产品。
1.识别事件中的触发词(举行)并判断事件类型(发布会)
2.抽取事件元素(自然语义公司、北京时间2月8日上午10点、青岛大剧院、 大数据搜索引擎、文本转换、语音识别、 赵毅) 同时判断其角色(公司、时间、地点、产品、人物)。
3.抽取出描述时间的词组或句子进行事件摘要描述。
(自然语义公司于北京时间2月8日上午10点在青岛大剧院发布产品大数据搜索引擎、文本转换、语音识别)
事件表格如下:
事件类型 | 发布会 |
---|---|
公司 | 自然语义公司 |
时间 | 北京时间2月8日上午10点 |
地点 | 青岛大剧院 |
产品 | 大数据搜索引擎、文本转换、语音识别 |
人物 | 赵毅 |
事件摘要如下:
(自然语义公司于北京时间2月8日上午10点在青岛大剧院发布产品大数据搜索引擎、文本转换、语音识别)
另外,此类方法是基于传统机器方式来处理,依赖依存分析、句法分析、词性标注等传统的外部 NLP 工具,还是会造成误差积累,另外有些语言和领域并没有这类处理工具,加之特征也需要人工设定。不过以事件为核心的事件图谱仍是未来知识图谱中的一个制高点。hanlp愿与君携手并进,共同推进技术升级以及应用落地。
感谢详细的说明。有demo 吗?
目前HanLP并无对事件抽取端到端的接口实现(鉴于对不同场景的业务逻辑)。
不过使用2.1的基础任务API接口,可实现就业务场景的事件抽取下游任务。
后期HanLP计划上线应用级场景接口,敬请期待。