展开

英语教育论文投稿关于英语语篇结构标注研究综述

发布时间:2018-11-15   |  所属分类:教育技术:论文发表  |  浏览:  |  加入收藏

这篇英语教育论文投稿发表了关于英语语篇结构标注研究的综述,我们国家的英语教育从小学就开始了,课件我们国家非常重视英语教学,语篇结构标注是英语基本的语篇单位,语篇结构树是通过连接语篇结构中主要语块而建成之。

英语教育论文投稿

论文关键词:英语教育论文投稿,修辞结构理论,篇章结构,标注

论文摘要:语篇结构标注起步较晚,但以修辞结构理论(RST)为指导之篇章修辞结构标注最近取得了令人瞩目之成绩。目前,已经建成并公布之篇章结构标注语料库是由美国南加州大学信息科学学院之一个课题小组完成之,由385篇文章组成,是一个大规模、高质量、高一致性之带多层语言学标注信息之参照篇章语料库。语料库建设之主要成就为:确立了如何将语篇切分为基本语篇单位之理论,扩展了修辞关系集,为RST理论之运用提供了广阔之前景。本文综述该语料库建设之研究成果。

0.概述

随着计算机技术之普及与发展,语料为机器可读成为语料库建设之最基本之要求之一。要达到语料机读化这一目之,关键在于语料之标注。所谓标注,就是对语料库中之原始语料进行加工,把各种表示语言特征之附码标注在相应之语言成分上,以便计算机之识读。

语料标注之类型主要包括语篇背景信息、词性、词形、句法分析、语义、语篇结构等。从当前之研究现状来看,虽然语篇结构标注起步较晚,但以修辞结构理论(RST)为指导之篇章修辞结构标注最近取得了令人瞩目之成绩。目前,已经建成并已公布之篇章结构标注语料库是由美国南加州大学信息科学学院之一个课题小组完成之,由385篇文章组成,是一个大规模、高质量、高一致性之带多层语言学标注信息之参照篇章语料库。在这基础上研究小组还进行了自动篇章标注算法、自动文摘、机器翻译等具体应用工程方面之研究。

该参照篇章语料库之建成不但为篇章结构标注建立了理论体系,而且为语篇结构之应用研究开辟了新之领域。本文将综述该参照篇章语料库建设之研究成果。

1.理论支撑之建立

根据Carlson(2001)之介绍,用于话语分析之理论有很多,如Groz与Sidner(1986)Mann与Thompson(1987)等都提出了自己之篇章分析理论,但这些理论主要用于单个之文本分析,往往着眼于语篇之某一个方面,如指代关系、语篇之风格、语篇之多维性以及某一理论在语篇中之体现等,很少被用于大规模之语料分析或语料标注。在建立参照语料库时,Carlson(2001)等研究者将Mann与 Thompson (1987)提出之修辞结构理论(RST)用于大批量之语篇标注与语篇分析。他们认为用修辞结构理论(RST)对语篇进行标注有三点优势:可以同时捕捉到特定文本之交际意图、语义信息与文本本身之特征;先前之研究表明该理论可以使不同之标注者在标注不同之文本时达到一定之统一;用该理论标注之语篇树形图对构建自然语篇生成系统、自动文摘系统、文本测评系统起着关键之作用,也可以用来增强机器翻译之自然性。参照篇章语料库之建成确立了篇章结构标注之理论基础。

2.基本语篇单位之确定

语篇结构标注之另一成就是确定了英语基本语篇单位。在确定基本语篇单位时,不同之研究者往往运用不同之理论。Givon(1983)认为从句应该成为语篇之基本单位,Sacks(1974)认为谈话之话轮应该成为语篇之基本单位,Polanyi(1988)坚持语篇应该以自然句为切分单位,Grosz 与Sindner(1986)认为语篇之基本单位应该从语篇之上下文中获取,它是由一定之符号所反映之信息载体,能反映事物之单个状态或部分状态,最有影响之修辞结构理论认为从句应该是语篇之基本单位,不管从句有没有语法标记或词汇标记。

然而,在具体标注时,Marcu等研究者对基本语篇单位有了新之规定:所有有词汇或句法标记之起状语作用之从句都属于基本语篇单位,包括起状语作用之非谓语动词词组;充当主语、宾语、补语之从句不属于基本语篇单位;定语从句、后置之名词修饰短语或将其他基本语篇单位割裂开之从句或非谓语动词短语为内置语篇单位;除此而外,还有一定数量之有明显语篇标记之短语作为基本语篇单位,如 由in spite of(尽管),according to(根据)等引导之短语。

Marcu之切分方法综合了Grosz与Sindner(1986)与Mann(1987)与Thompson(1987)之理论,在确定基本语篇单位时考虑到词汇、句法、语义与在句中之位置等因素。

3.修辞关系之扩展

当初,Mann与Thompson(1987)提出修辞结构理论时只给出20多种修辞关系,但他们明确指出这是一个开放关系集,既然是开放性之,就意味着读者在给定话语之内部可以定义出其他之关系类型。Marcu(2000)根据标注之语料库总结出53种单层核心关系与25种多层核心关系,78种定义关系又分成16个组别,每组都具有相同之修辞功能。

转载请注明来自:http://www.uuqikan.com/jiaoyujishulw/15149.html


上一篇:教师期刊投稿教师与新课程一起成长
下一篇:教学实验论文发表如何开发物理实验的各种资源