摘要:本文首先简介了语料库的属性及发展,然后分析和评估了语料库数据资料对语言习得和语言学研究中可能做出的贡献。在应用语言学的领域中,将语言直觉linguistic intuition和语料库corpus对处理语言研究问题上的作用做了对比,分析了人们对此两种工具的需求。
关键字:语料库 语言直觉 语言习得 语言应用
1. 语料库简介
语料库是一系列的在真实情况下使用的口头或者书面的具有代表性的语言样本,此类样本被记录和收集起来通过一些语言分析工具来进行语言学的研究。实质上语料库就是解决语言学难题的工具之一,它来源于日常生活中的对话,写作,报刊杂志或媒体影音等。语料库分为通用语料库和专门语料库两大类。前者是收集某种语言的具有广泛代表性的各种语言数据,可用于分析这种语言中的各种现象;后者是收集某个方面的语言素材,例如口语语料库,学习者语料库,医疗英语语料库等,用于专科专项研究。起初语料库的创立和编辑是为了语言学研究的目的,后来它在语言教学上的重要应用也被发掘。因为语料库中的素材是发生于真实世界的,所以借助语料库的帮助,语言学习者可以通过自己的方式来测试语言信息和语法理论条款是不是正确或实用,而不是单一地模仿来习得语言。
语料库在上世纪40到50年代在结构语言学这个领域逐渐为人们所了解,但是在那个时候语料库的普及面临两个障碍:第一,无论语料库这个理念有多好,在实际操作中深入研究的技术还不够成熟,也就是当时计算机技术以及分析软件的开发还处于初级阶段;第二,即便是在当时语料库解决了一些语言学研究的问题,这些问题早就已经可以用其他途径来得到完美解决。
直到1957年乔姆斯基的Syntactic Structures 一书的出版,语言学者们才意识到语料库这个工具并没有得到合理开发利用来发挥它真实的价值。语料库被重新赋予重视,而且依靠语料库来解决问题的范围向更宽广的领域探究。后来随着在计算机上的大型可阅读的语料库的创立,海量语言数据可以轻松快捷地分析处理。诸如信息检索,文本过滤,文本分类,抽取数据等语言处理技术得以进一步提升。也就是学者们对于语料库这个概念在创立初期的一系列不实际的想像逐渐变为了可实际操作的步骤。
2. 对语料库的需求及其实用性争议
习得一门语言的目的是在于运用这门语言到实际生活中,实现交流的目的,培养交际的能力。因此为学习者创建一个真实自然的目的语环境非常必要。大量真实的语言范例可以利用语料库索引软件,简易地从海量库存中抽取出来,以提供学习素材和营造目的语的真实环境。总的来说,语料库跟其创立之前的很多语言习得工具和途径有着很大差别,在外语教学中它帮助减少了课本上教授的语法项目与实际人们正在使用的语言之间的差异;它也可以辅助母语者和第二外语学习者发现以往没有注意到的语言规律;它可以帮助我们清楚认知在不同语境领域中词汇出现频率的差异;也可以帮助我们宏观归纳某些词语在实际交际中的意义和用法。
虽然语料库的作用是显而易见的,但是在语料库创建于发展中,很长一段时期关于语料库的各种争论一直存在。比如一些学者们质疑语料库是否必要。一方面,对于以某种语言为母语的人,仅仅依靠他们对语言的直觉,或者说是他们的语言能力或语感,是否足够为他们自己解决语言应用中的问题;母语者是否可以通过语料库撰写出语言规则,而这些规则可以对所有母语者说出的语法合理的句子做出解释;另一方面,如果一个外语学习者说出了一句 “I am studying Chinese since four years”, 这句话是否需要放到一个大型语料库中来检验它出现的可能性或频率,还是母语者就直接凭直觉和习惯判断这句话就是语法错误。
以上这些争论和疑问最终都是不具现实意义的。在实际生活当中,两种途径都会被使用来解决不同的语言应用问题。母语者的直觉用于解决相对小的语言碎片的问题上是足够的,而语料库在解决大领域的语言问题上是被需求的。比如,当gril, pretty 和 a 这些词在一起时,我们不需要靠语料库来判断正确顺序应该是 a pretty girl; 我们也不需要语料库来告诉我们son读音听起来像sun而不是song. 另一方面,没有语言素材协助的语言直觉,不可能告诉读者could 这个词出现在一篇新闻报道中的频率,以及它左右搭配的词的频率;再比如and这个词,母语者可以靠语言直觉制定规则说中间的n要同化,末尾的d要弱化,但是单个人的直觉不可能告诉我们这个词在某个地区的典型读音是怎样的。
在处理语言应用的问题上,如果说没有语料库支撑的语言直觉是不够的,那么没有语言直觉辅助的语料库也是不够的。语料库提供大量的数据,之后的分析处理上需要借助直觉。比如1000个关于could这个词的语料库句子,本身是繁乱而且不具意义的,需要某种人们对情态动词的直觉上的认知敏感或者使用习惯来归纳总结,从而可以合理地分类及系统地分析它们。而对于人们习惯的一些,所谓可以靠直觉来判断正误或调整语法的小语言块,语料库也不是不能发挥其作用。比如学习者甚至是母语者可以在轻松查看一个词在生活中最常用的语境和上下文,以检验自身语言敏感度。它甚至可能改变母语者以往不恰当的语言习惯,对语法传统的看法,从而重新审视自己的语言。或者对专业性强的领域,比如语料库可以分析某公司的投诉单,顾客针对那个产品提到的频率最高甚至哪个产品被投诉时顾客最倾向用哪些句子单词来描述,从而公司可以研发出一系列细节应对措施。恰当运用语料库加分析工具,可以使多个领域的研究工作拥有更充分的依据,对依据的概括更系统,效力和可信度也会提升。所以语料库从某个角度来说,是可以与人们每日的写作对话紧密联系的,是可以活跃在人们每一项日常生活中的一种工具。
3.总结
在很长一段时间里,语料库的使用将逐渐改变语言学家和语言学者表达和传播语言信息的方式。传统的语言学习语法书也许会给我们提供语言点最权威的使用规矩,对于已经习得的语言的直觉语感也许会在语言运用中发挥导向作用,而以统计数量这个脉络来实行其效力的语料库,可以针对这些权威的语法点和约定俗成的语法结构是否典型,是否更实用,进行更准确的评估。语料库将不仅限于在语言研究者在学术中的运用,它还会走进人们的日常生活,以及非语言学范畴的其他专业工作学习中,起到多项作用。
参考文献:
[1]Knowles,G.,Taylor,L.and Williams,B.J."A Corpus of Formal British English Speech". London: Longman.
[2]Garside,G.,Leech,G.N.and Sampson,G.R.,eds, (1987).The Computational Analysis of English. London: Longman.
[3]Svartvik,J.and Quirk,R. (1980)."A Corpus of English Conversation". Lund Studies in English 56.Lund:CWK Gleerup.
[5]顾曰国.语料库与语言研究.当代语言学 [J]. 1/1998.
[6]杨慧中.语料库语言学导论[M].上海外语教育出版社,上海,2002.
[7]谢应光.语料库语言学与外语教学 [J].外语教学与研究.
查看全文
false