作 者: ;
机构地区: 北京语言大学信息科学学院语言信息处理研究所
出 处: 《中国语文》 2013年第6期483-494,575,共12页
摘 要: 本文面向语言工程的需求研究汉语篇章的话题结构。本文的工作以标点句为基本单位,提出广义话题结构的概念和表示方法,归纳出广义话题结构遵从的堆栈模型并拓展为流水模型,指出广义话题结构的两个重要性质:话题的不可穿越性和话题自足句的成句性。广义话题结构的分析对于说汉语者具有可操作性,流水模型对于汉语文本有高覆盖率,数十万字多种语体文本的广义话题结构标注已经初步完成。这些事实说明,广义话题结构确实是理论上和应用上有本质意义的汉语篇章结构单位。 This paper analyzes topic structures of Chinese texts from the language engineering perspective.With Punctuation Clause(P-Clause) as the basic unit,it 'proposes the definition and the representation of Generalized Topic Structure(GTS),summarizes the stack model of GTS,and then extends it to a stream model.There are two crucial properties of GTS:the uncrossibility of the topic and the sentence-formability of the Topic Sufficient Sentence.After tagging the texts of various styles over 100,000 words,it shows that GTS analysis is operable and the stream model has a high coverage for Chinese texts.
关 键 词: 标点句 广义话题结构 话题自足句 堆栈模型 流水模型
领 域: [语言文字]