研究,汉语词语,意思是主动寻求根本性原因与更高可靠性依据,从而为提高事业或功利的可靠性和稳健性而做的工作。出自刘义庆 《世说新语·文学》。下面是我本站为大家带来的基于COCA语料库的英语近义词对比研究 ,希望能帮助到大家!
基于COCA语料库的英语近义词对比研究【摘要】英语中存在大量的近义词,如何选词恰当是大多数英语学习者想要解决的问题。词典、直觉等传统方法存在着不足,较难准确区分近义词,大型语料库为近义词辨析提供了新的视角。本文选择capacity,capability和competence作为研究对象,使用定性与定量方法,分析三个近義词在语域、搭配、语义韵中的特征以及三者的不同之处;笔者发现通过语料库辨析近义词的方法在近义词辨析中行之有效,也为学习者提供一种近义词辨析的新视角。
【关键词】语料库;近义词;语域;搭配;语义韵
【中图分类号】H313 【文献标识码】A
基金项目:“中国古都天下大同”城市形象与外宣翻译规范化研究(项目编号:2018Q20)。
词汇在语言学习中至关重要。英语单词中有60%以上是由近义词构成的,而中国英语学习者对近义词的误用占很大比例。Lewis论证了无论听说读写,词汇都是语言使用的核心。英语不仅是世界上单词数量最多的语言,而且也是近义词数量最多的语言。如何区分近义词一直是英语学习者想要解决的问题。
一、学习英语近义词的重要性
英语学习者一般在词典里查单词或者仅仅依靠自己的直觉和经验区分近义词。然而,词典并不能提供全面的解释,它所呈现的只是近义词的相似意义。许多英语学习者意识到选择最准确、最恰当的词来表达自己的观点有一定的难度。大型语料库和索引软件的出现,为近义词的研究提供了新的视角和途径。语料库是一个非常有用的工具,通过从语料库中检索大量真实语料,可以实现词的搭配和细微的语义韵特征的分析,给外语学习者掌握英语近义词提供更多帮助。
二、研究方法
(一)语料库
本研究使用的语料库是当代美国英语语料库COCA。COCA是由美国杨百翰大学的马克·戴维斯教授开发的,免费提供大型且类型均衡的美式英语语料库,包含超过10亿单词,其中包括1990年至20xx年每年2000万单词。它是学习者寻找和观察美式英语的使用和变化较全面的工具。该语料库分为八种体裁,包括口语、小说、流行杂志、报纸、学术文章、电视和电影字幕、博客及其他网页。
(二)近义词的选择
近义词是各种语言中普遍存在的现象。由于法语、拉丁语等大量外来词与英语的结合,产生了多种英语近义词。近义词又可分为完全近义词和部分近义词两部分。前者是指在任何语境中没有语义差异、可以相互替代的词语。然而,在任何一种语言中,很少有单词有相同的意思、用法和搭配。后者是指尽管意义相同或相近,但存在细微差异的词语,例如不同地区的方言或在文体学、用法与搭配、语义韵等方面存在差异。对所有的英语近义词进行研究有很大的难度,所以以一组近义词为例是十分合适的选择。近义词有两个原则:首先,这组近义词对于母语为英语的人和英语学习者来说都属于高频词。其次,近义词总是被错误地使用,英语学习者很难识别它们的区别。基于这两个原则,笔者选择了一组典型的英语部分近义词capacity、capability和competence为研究对象。在《牛津高阶英汉双解词典》中,capacity指理解或做某事的能力;capability指做某事所必需的能力或品质;competence是指做好一件事的能力。从以上的解释可以看出这三个词都与能力有关。然而词典提供的词义和例句有限,英语学习者很难有效地区分近义词。因此,利用语料分析这一组近义词意义和使用语境是很有用的。
三、研究过程及语料分析
基于语料库中的语料,本文对从语料库中提取的真实语料进行了定量和定性分析。首先在语料库中搜索三个节点词capacity, capability,和 competence,得到三者的出现频率以及在不同语域中的分布情况。其次搜索搭配列,获得三个近义词的常用搭配。第三,根据检索的搭配分析三个节点词的语义韵。最后,分析capacity、capability和competence在语域、搭配和语义韵中的异同。
(一)语域分析
语域可以用来观察词汇的用法,以区分一般英语和特殊英语。Palmer认为近义词可能在语域、搭配和说话人的态度上存在差异。根据近义词在不同语域中的分布情况,可以将其区分开来。在COCA语料库中查询capacity、capability和competence的使用情况,得出如下结果:上述三个近义词中,capacity的出现频率最多,capability其次,competence最后。这说明人们倾向于使用capacity和capability。此外,capacity和competence的单数形式比复数形式使用得更频繁。但capability的复数形式出现的频率略高于单数形式。
在COCA的图表栏中分别输入capacity、capability和competence,得到它们在口语、小说、流行杂志、报纸、学术文章、电视电影字幕、博客和其他网页中的频率分布。PER MIL为per million,适用于大型语料库的数据统计和频率标准化处理。结果表明上述三个近义词在学术文本中的使用频率要高于其他文本。就capacity而言,学术文章的频率占了总频率的近三分之一。此外,capacity在网络、博客、杂志和报纸上的使用频率较高,说明其具有明显的学术特征。就capability而言,其在不同语域中的出现频率分布更加均匀。capability的使用在学术文章中最常见,其次是口语。与其他两个词相比,capability在口语文本中出现的频率更高。competence具有最强烈的学术特征,其在学术领域的使用频率约占总使用频率的三分之二。搜索不同语域的频率分布,可以为英语学习者获取语言知识提供了不同的视角。
(二)搭配分析
在观察节点词与其他词的搭配时,主要研究节点词的左或右出现的四个词。一种搭配出现的频率越高,说明它与节点词的关联度越高,搭配强度也越大。此处采用互信息值(MI)对词语搭配强度进行分析。MI值是指两个词同时出现的可能性与节点词单独出现的可能性的比较。如果MI值为0,表示这两个词没有匹配在一起。如果它高于3,这意味着这两个词经常一起使用。选择MI值大于3进行研究更恰当。在COCA搭配列中,分别在词/短语列中输入capacity、capability和competence,得到其搭配。
根据COCA的研究结果表明,这三个同义词具有不同的搭配特征。capacity一词与计算机、技术、设备、人、经济、计量单位和国家相关的能力。capability主要用于军事领域,也指与国家、技术、发明、人、行为相关的能力。而competence这个词是关于人际交往,文化,人,知识,体育和评价的能力。
(三)语义韵分析
语义韵是选择搭配词的重要原则。笔者选取了这三个近义词最常见的100个搭配,并对它们的语义韵进行分析,发现capacity具有较强中性语义韵特征。在100种常用搭配中,积极、消极和中性语义韵分别占21%、9%和70%。而呈现中性语义韵特征的搭配大多是术语,说明capacity在正式场合的使用更为频繁。而capability在大多数情况下呈现出中性语义韵特征,比例为76%。capability的积极语义韵占18%,消极语义韵所占比例相对较低,只有6%。与competence搭配词的70%属于中性语义韵,也就是说其语义特征总体上是中性的。与其他两个同义词相比,competence具有明显的积极语义韵特征,而消极语义韵仅占3%。
四、结语
三个近义词中,capacity在COCA中的出现频率相对较高,其次是capability,最后是competence。三者都具有显著的书面特征,其中competence的学术特征最明显,其次是capacity。capability的頻率分布更加均匀,在口语文本中使用的频率比其他两个词都要高。它们都可与技术相关的词语搭配,但与competence相关的搭配并不多。三者可以与人的能力搭配;capacity和capability可与国家搭配使用;capacity可以与经济或度量单位搭配;而capability可用于军事领域,也可用来表示行为;competence可与人际交往、文化、体育和评价等搭配。在语义韵方面,三者都呈现出较强的中性语义韵特征,积极语义韵所占比例高于消极语义韵。学习者通过语料库提供的大量例子,更容易理解词汇的意义和搭配。在教学过程中,应鼓励学习者利用语料库,对近义词的使用情况有全面的认识。
参考文献:
[1]贺晓东.英语同义词词典[Z].北京:商务印书馆,2003.
[2]Lewis,M.The lexical approach:The state of ELT and a way forward[M].Beijing:Language Teaching Publications,1994.
[3]Palmer,F.R.Semantics[M].Cambridge:Cambridge University Press,1981.
[4]Church K,Hanks P.Word Association Norms,Mutual Information,and Lexicography[M].Cambridge:MIT Press,1990.
[5]王春艳.基于语料库的中国学习者英语近义词区分探讨[J].外语与外语教学,2009(6):30-34.
作者简介:武建萍(1985-),女,汉族,xxxxxx人,硕士,山西大同大学外国语学院,助教,研究方向:应用语言学;侯珂(1998-),女,汉族,xxx大同人,山西大同大学外国语学院学生,研究方向:应用语言学。
基于COCA语料库的英语近义词对比研究美国当代英语语料库(Corpus of Contemporary American English,简称COCA)是目前最大的免费英语语料库,它由包含5.2亿词的文本构成,这些文本由口语、小说、流行杂志、报纸以及学术文章五种不同的文体构成。从1990年至20xx年间语料库以每年增加两千万词的速度进行扩充,以保证语料库内容的时效性。因此,美国当代英语语料库被认为是用来观察美国英语当前发展变化的最合适的英语语料库。
与传统词典相比,COCA具有以下几点优势:
(1) 语料库的文本实时性比较强,类似life satisfaction, social media这样的词很多传统词典都没有收录,但在语料库中都可以查到。
(2) 语料库可以提供单词的词频信息,这有助于我们了解该单词在实际应用中的出现频率,有助于实现准确用词。
(3) 语料库还能提供模糊搜索和单词搭配等功能。
实际使用时可以将语料库作为词典的补充工具,在词典里面无法确定的表达可以放到语料库中查询,以获得更多信息。下面是COCA的几个常见操作:
01
确认表达是否地道
这是语料库最基本也是最重要的一个功能。我们有时候会碰到一些模棱两可的表达,比如“用鼠标点击一下”是at the click of a mouse还是with the click of a mouse? “普通人”译为the common people是否为中式表达?这些细琐的知识点都可以在语料库中找到答案。
对于第一个问题,我们可以在COCA的网站上搜索at the click of a mouse
结果表明这个表达在语料库中有30处例证,并且at the click of a mouse的意思与我们预想的一致,比如这是其中一句:Thanks to the internet, several lifetimes' worth of gardening wisdom is available at the click of a mouse. 这说明at the click of a mouse这个表达没问题。
再用相同的方法验证with the click of a mouse,我们会发现该表达在语料库中也有37处例证,而且与我们预想的一致。这说明at / with the click of a mouse这两个说法都是正确的。
至于the common people是否为中式表达,各位可以亲自到COCA上查一查。
02
确定单词的使用语境
COCA的一个特色功能是能统计一个单词或短语在口语、小说、流行杂志、报纸以及学术文章五种不同文体中的出现频率,这意味着我们可以根据这些词频来确定它们的最佳使用场景。
举个例子,在学术写作中,我们一般推荐学生用many来代替a lot of,因为a lot of是一个非正式表达,更多出现在口语中。对此,我们在COCA中可以找到例证。
选择网站列表的Chart功能,然后输入a lot of,点击See frequency by section,我们可以看到a lot of这个词组在口语、小说、流行杂志、报纸以及学术文章这五种文体中的出现频率:
结果表明,a lot of在口语中出现了超过10万次,在小说、流行杂志、报纸中出现的次数也都超过了1万,但在学术文章中只出现了4000多次,这说明它在学术文章中的使用频率偏低。
对比一下a lot of的同义词many,我们会发现它在学术文章中的出现频率较高,超过11万次,这说明在学术文章中使用many会比用a lot of更为合适。
下次遇到不确定使用语境的单词时不妨放到语料库中查一查,如果你发现它在某一文体中出现频率很低,那使用时就要多加注意了。
03
比较近义词的区别
近义词辨析是一个让人感到头疼的问题,有时候即使借助词典也找不到满意的答案,这个时候语料库就可以派上用场了。
COCA有一个很好用的“比较”功能,这个功能可以用来比较两个近义词的区别。
举个例子,murder和assassinate都有“谋杀”的意思,两者有哪些区别呢?
在COCA网站中选择Compare功能,然后在Word1和Word2中分别输入murder和assassinate,Collocates框中输入_nn*(表示查询的是与murder/assassinate搭配的名词),最后在下方的数字框中分别选择3和3(表示查询文本中与murder/assassinate相距三个单词及以内的所有名词)。
我们可以得到这样的结果:
从上面的表格中可以看出,与assassinate搭配的大都是leaders/president/ambassador/king这类重要人物,但与murder搭配的更多为wife/victim/husband这类常见对象。而且某些特定单词只能跟murder搭配,比如murder scene这一搭配在语料库中出现了372次,但assassinate scene出现的次数是0次,说明在英语中很可能没有assassinate scene这样的用法。
又比如valuable/invaluable,两者都可以表示“宝贵的”,但在COCA的搭配中可以发现这样特点:
valuable更多用于搭配player/land/space/commodity/estate这样的实物,而invaluable则搭配help/assistance/guidance/support这类抽象事物,而且对于space/land/award这几个名词,我们只能说 valuable space/land/award,而不能说invaluable space/land/award
04
寻找合适的用词
COCA的另一个特色功能是同义词选择功能。我们可以根据语料库的建议选择更加合适的用词。
举个例子,有个同学想表达“我们城市有一个很高大宏伟的超市”,英文写成:There is a large and tall supermarket in our city. 细读这个句子你会发现,tall supermarket这个表达很别扭,而且在语料库中找不到例证。应该换成什么单词呢?COCA可以给到答案。
在网站上选择List功能,输入 [=tall] supermarket(这个指令表示寻找tall的近义词,并且该近义词要能够与supermarket搭配),结果如下:
根据语料库给出的建议,a big/giant/colossal supermarket这几个表达都可以用来替换a tall supermarket
又比如:Young people often take an interest in what is happening outside their own country. 如果你想寻找take an interest in的替换表达,可以搜索 [=take] an interest in
从语料库给出的结果我们可以找到 show/acquire/get an interest in这些替换说法。
05
寻找句式
《哈姆雷特》中有一个著名的句式:To be, or not to be: that is the question. 有没有想过可以用语料库来寻找类似的句子?
在COCA中输入 to [v*] or not to [v*](其中[v*]代表动词),可以找到很多类似的说法,例如:To do or not to do / To see or not to see / To eat or not to eat 等等。
使用通配符还可以查找一些特殊用法,比如搜索 [v*] * into [v?g] 可以找到“动词接任一词再接into V-ing”的结构,例如fool you into thinking / talked him into going / trick people into thinking 等。
除此之外,COCA还有一些奇技淫巧,有时候在特殊场合能够用上。
例如搜索 *light* 可以找到所有包含light的词,比如slight/flight/delighted等。搜索 un*ly 可以找到所有以un开头,以ly结尾的单词,比如unlikely / unexpectedly / unfairly / unruly 等。搜索 it is [v*] that 则可以找到所有结构为 it is + verb + that 的句式,比如 it is estimated that / it is said that / it is believed that / it is assumed that / it is recommended that
更多的语料库用法欢迎各位自行探索。
注意:使用COCA时建议注册一个账号(语料库的使用和注册都是免费的),不然会有查询次数限制。关于查词的语法可以参考网站右侧的使用说明。祝使用愉快!
基于COCA语料库的英语近义词对比研究大家好,欢迎来到COCA美国当代英语语料库教程。今天的视频将演示如何在语料库中实施同义词检索。
要进行同义词研究,需要确保选择了屏幕左侧“display”功能的“list”,然后再输入单词,例如,在框中输入“beautiful”,用括号括住,在括号里和“beautiful”之前输入“=”,即“[=beautiful]”即可找到“beautiful”的同义词。你会看到“beautiful”的同义词包括 “wonderful, attracting, striking, lovely”另外也能在屏幕右侧的看到每个同义词出现在语料库中频率。更有趣的是,在语料库中有大量的同义词串,点击同义词旁边的“s”,将会找到同义词的同义词,“striking”是“beautiful”的同义词,但点击“striking”旁边的“s”,同义词将会改变,搜索框中的“beautiful”一词也被“striking”所取代。这个过程可以根据需要重复多次。
同义词检索是可行的,因为资源来源是语料库。但是,它不适用于检索具有多个意思或词性的单词。例如,如果搜索“clean”的同义词,会发现形容词“clean”的意思是“fresh”,动词“clean”的意思是“dust”或“polish”,这些在检索结果里都会出现。
当然,如果输入“role”这个词,“role”的同义词可能是“a job”、“a person”、“a postition”或“a character in the play or a movie”。因此,可以找到具有多种意义的单词的多个同义词。
短语的搜索与单词类似,例如,“[=clean]the kitchen”,需要注意的是“clean”放在括号中,而不是整个短语,然后会发现“scrub the kitchen”或“wip the kitchen”,使用频率也会显现出来。但单词的使用可能会是不同的形式,这就需要添加第二组括号来查看同义词的所有反映形式,如“[[=clean]]the kitchen”,就能找出同义词的不同形式,如“scrub the kitchen”“cleaning the kitchen”和“scrubing the kitchen”。
查看全文
false