科技与生活

期刊导读

计算机软件及计算机应用论文_科技术语自动提取

来源:科技与生活 【在线投稿】 栏目:期刊导读 时间:2021-12-16
文章目录

引言

1 自动术语提取的任务定义

2 术语的组成和统计特性

3 单元度和术语度

3.1 单元度计算

    (1) 基于点式互信息的单元度计算

    (2) 基于t值的单元度计算

3.2 术语度计算

    (1) 基于项频率-逆向文档频率的术语度计算方法

    (2) 基于C-value和NC-value的术语度计算方法

4 术语提取的一般流程

4.1 提取术语候选

4.2 评分和排序

5 自动术语标注和机器学习

5.1 序列标注模型

5.2 术语标注语料库

6 自动术语提取与标注的评价

7 结语

文章摘要:文章简要介绍了自动术语提取任务的定义、主要方法和评价指标。针对传统的自动术语提取方法,以互信息、t值、tf-idf、C/NC-value为例介绍了单元度和术语度的概念;针对自动术语标注方法,主要介绍了基于序列标注的建模思想。从提取效果来看,现有自动术语提取技术距离期望仍有差距,文章也尝试给出了一些值得探索的方向。

文章关键词:

项目基金: 上一篇:信息经济与邮政经济论文_美国对华数字竞争战略 下一篇:没有了