《科技与生活》
引言
1 自动术语提取的任务定义
2 术语的组成和统计特性
3 单元度和术语度
3.1 单元度计算
(1) 基于点式互信息的单元度计算
(2) 基于t值的单元度计算
3.2 术语度计算
(1) 基于项频率-逆向文档频率的术语度计算方法
(2) 基于C-value和NC-value的术语度计算方法
4 术语提取的一般流程
4.1 提取术语候选
4.2 评分和排序
5 自动术语标注和机器学习
5.1 序列标注模型
5.2 术语标注语料库
6 自动术语提取与标注的评价
7 结语
文章摘要:文章简要介绍了自动术语提取任务的定义、主要方法和评价指标。针对传统的自动术语提取方法,以互信息、t值、tf-idf、C/NC-value为例介绍了单元度和术语度的概念;针对自动术语标注方法,主要介绍了基于序列标注的建模思想。从提取效果来看,现有自动术语提取技术距离期望仍有差距,文章也尝试给出了一些值得探索的方向。
文章关键词: