
- 收藏
- 加入书签
基于语料库的本族语者与英语学习者对于同义词运用差异的研究
——以处理类动词handle和solve为例
【摘要】通过对比分析英国国家语料库(BNC)与中国学习者英语语料库(CLEC),使用Wordsmith检索工具,从词频分布、语域分布、搭配行为、类联接、语义偏好和语义韵六方面对处理类同义词“handle”和“solve”分别进行本族语者与英语学习者运用情况的区分。通过发现本族语者与英语学习者运用handle与solve的不同,揭示造成此差异的原因。
【关键词】语料库;词频分布;语域分布;搭配行为;类联接;语义偏好;语义韵特征;同义词
一、引言
英语作文是很多学生难跨过的一道坎。大多数学生不知道或者不会正确使用同义词。同义词的传统教法是:教师教授大多是借助于词典,简单的将两个或几个同义词对等,偶尔做一些基于经验的区分。这种教法下的学生只大概知道其区别,然而仍然不会正确的使用。教学能力较强的老师会列举几个句子,给学生机会在语句上理解词的用法。另一个问题值得我们探讨:这些句子的可信度如何?换句话说,这些列举的句子能完全代表本族语使用者的真实用法吗?目前为止,这种教法仍然不能提供地道的用法给英语学习者。随着科技的兴起与发展,语料库的出现为英语学习提供了大量、真实的本族语使用者的语句。教师合理运用语料库能一方面提高同义词教学的准确性。另一方面,英语学习者同义词的使用与本族语使用者的使用对比结果可以促进教师分析此类错误的背后成因并且给出相应的解决对策。本研究拟从语料库语言学的角度,通过对相关的语料库进行检索分析,发现同义词在词频分布、语域分布、搭配行为、类联接、语义偏好和语义韵六个方面的研究对英语教学有重要意义。
二、研究背景
(一)同义词的定义
根据韦氏大学词典的定义,同义词是指在同一语言的一个或多个词或者表达具有相同或相近的意义,并且这种意义在一种或者多种层面上一样。同义词大致可以分两种:绝对同义词(Complete Synonyms)和相对同义词(Relative Synonyms)。此文中,Handle与solve同为处理类动词。根据牛津高阶学习词典,Solve的意思是找到解决问题和困难处境的办法。handle的意思是如果有人能解决某个问题或者处境,这就意味着他们能成功得处理它们。乍看之下,两者完全没有区别。然而,同义词一般只是具有相同或相近的概念意义,而搭配词并不能随意替换。
(二)基于语料库的同义词研究的发展
语料库一词于1980年第一次出现。然而,基于语料库的研究却数不胜数。基于语料库的同义词研究也相继出现。1992 年,Rundell基于英语口语和笔语语料库对 begin 和 start 进行了研究。2000 以后,Biber,Kennedy和Thomas基于语料库进行了同义词用法、使用的语境和语域的不同的研究。
2003 年国内开始了第一次基于语料库的同义词研究。大部分研究集中于基于错误分析以及搭配、类联结后逐渐开始以易混淆的同义词为例进行定量与定性研究,以更好地区分同义词在搭配、语义韵以及类联结上的不同。众多基于语料库各种词性的同义词研究不断涌出——动词、名词、形容词、副词……截止于2022 年,国内基于语料库的同义词的研究共432例,然而研究的实例与角度相对于较少,英语教学领域仍需要大量实例的研究。本研究基于国内外的语料库,选择以HANDLE和SOLVE两个同义词为例,从词频分布、语域分布、搭配行为、类联接、语义偏好和语义韵六个视角进行对比分析。一方面,考察中国英语学习者对此两个同义词的习得情况。另一方面,根据中国学习者与本族语之间的差异进行分析,探究差异形成的原因,并探究如何在教学上进行避免。
三、研究设计
(一)研究问题
本研究试图回答以下三个问题:
(1)就英语本族语者而言,HANDLE 和 SOLVE 在词频分布、语域分布、搭配行为、类联接、语义偏好和语义韵方面有何特点?
(2)中国英语学习者在习得方面有何表现?与本族语者相比较有何异同?主要体现在哪些方面?
(3)影响中国英语学习者正确习得同义词的主要因素有哪些?
(二)研究工具
本研究使用的语料库有中国学习者英语语料库 CLEC(桂诗春等,2003),其有 5 个子库 ST2、ST3、ST4、ST5 和 ST6 (分别代表中学、非英语专业低年级与高年级、以及英语专业低年级与高年级阶段的学习者英语) 。各个子库的语料题材相近, 库容量均为20万字左右, 具有很好的可比性。此外还使用 BNC(British National Corpus)作为参照。BNC 是由牛津大学出版社于 1980 建立。其库容量为十亿,体裁包括口语、小说、杂志、新闻报纸、以及学术文章等。最后,使用Word Smith Tools 4.0作为本研究的检索工具。
(三)研究步骤
为了得出在词频分布、语域分布、搭配行为、类联接、语义偏好和语义韵六方面的差异, 该研究主要按照以下步骤依次进行:
第一,词频分布提取。在BNC中, 在语料库检索界面输入单词的大写形式以便囊括所有屈折变化形式。为确保所的结果均为动词,需输入HANDLE_v得出其动词形式的所有词频;在CLEC中,因为 handle 有名词意义,故需要提前将 CLEC中的文本赋码,检索时只用检索动词形式手动剔除不符合动词意义项。然后使用 Word Smith4.0 语料库分析软件分别进行检索得出检索词的所有词频。最后,在检索完两个检索词后都需选择Edit中的 Remove duplicates 来剔除重复行。
第二,语域分布提取。在 BNC中, 在语料库检索界面输入HANDLE_v。同时,在选项处选择语域分布的文体,勾选口语、小说、杂志、新闻报纸、非学术以及学术文章可得出不同语域的词频分布;在 CLEC 中,由于收集的数据都是作文,故得出的语域可以算作是非学术与学术文章。
第三,搭配词提取。在 BNC 中,在“collocate”功能选项下分别以HANDLE和SOLVE为节点词,在跨距为±4 的范围内提取。为了得出常见的搭配,可利用相互信息值(MI)来测量搭配词与节点词组之间的显著搭配程度。将选项设置为MI≥3,按照频率排序,再对相应的有效索引行的搭配词进行定性分类并根据语境剔除不符合义项要求的部分。在CLEC中,使用 Wordsmith 软件分别输入handle*和 solve*,在检索结果界面选择 collocate,按照频率排序,再进行分类、剔除不符合项并计算各个搭配的MI值。之后,综合对比分析其搭配行为异同。
第四,类联结提取。在 BNC 语料库中得出“handle”与“solve” 的100 条搭配,将其进行总结归纳,并分别计算所占百分比。
第五,语义偏好提取。在 BNC 语料库中得出“handle”与“solve” 的 100 条搭配词,将其进行按照不同语义倾向进行整理。
第六,语义韵标注。在BNC的“compare”一栏中分别将 handle和solve设定为 Word1 与 Word2,并将跨距设为±4 检索搭配词来进行对比分析。标注过程中,若存在不能明确反映其语义韵的索引行,则需获取上下文语境信息。在分别概括出两词组的语义韵之后,进行综合对比分析。
最后,统计分析与讨论。
四、研究结果与分析
从BNC中handle与solve的词频分布和语域分布可知:一、在本族语中 handle的使用频数是5667,solve的使用频数是3673。 handle 的使用频数比 solve 多 1 倍多,由此可得出本族语更常使用 handle 来表示“处理”。 二、在语域方面,handle 大多数用于杂志、小说、报纸、非学术以及学术期刊,Solve 多用于学术与非学术期刊。由此可得出 handle 的语域范围比solve 更为广泛。
由CLEC中handle与solve的词频可知:一、在英语学习者中handle的出现次数为18,solve 的出现次数是294。solve的使用频数是 handle的16倍多,由此可得出英语学习者更常使用solve来表示“处理”。二、在英语学习者水平方面,ST2几乎不使用handle,大多数都是ST3与ST5使用handle,而 Solve 多被 ST3英语学习者使用,ST4、ST5 和 ST6 的使用情况大致上均居于次位。三、英语学习者在使用 handle 时常使用不定式,使用solve时常用不定式以及被动形式。
由 BNC与CLEC 语料库对比可知:一、在处理类动词中,英语学习者比本族语更常使用solve。二、相比较于非英语专业的英语学习者,英语专业的英语学习者(ST5/ST6)遇到需使用处理类的动词时较多使用handle。
由 BNC与CLEC中搭配对比可知:一)在 BNC中,handle 搭配的名词有419 次,副词 143 次。在CLEC 中,handle常与不定式搭配,频数是6次,副词6次,名词5次。二、在 BNC中,solve搭配的名词有2388次,副词有21次。在 CLEC中,solve常与不定式搭配,频数是143。与名词搭配的频数是94。副词的频数是7。三、英语学习者在使用handle、solve 时常用不定式。四、与本族语者相比,英语学习者在使用handle时搭配名词数量以及种类较少,而对副词的搭配使用率较高。五、英语学习者与本族语者在solve的名词与副词搭配上基本一致,可以说英语学习者对于solve的掌握比handle较好。六、尽管英语学习者 solve的掌握情况较好,但是仍然出现不地道的搭配:solve our food question(living standers is improved in developing countries. Not only did we solve our food question, but we attach importance to nutrition),这句是出现在英语专业低年级(ST4)的英语作文-Health Gains in Developing Countries 中。这可以说明较高水平的英语学习者的同义词使用仍然存在滥用的情况。
关于类联结,本族语中 handle 和 solve 常接不定式和多用于被动语态。英语学习者常使用handle和solve的不定式形式,唯一的区别是 handle常接副词,Solve后常接名词。
在语义偏好上,由BNC与CLEC中的数据可知:一、本族语中handle常与data,situation,affairs,complaints,transactions 等名词搭配使用,故handle 偏向于日常事务与商业领域。solve常与problem,mystery,equations,puzzle,crisis,murder,riddle,difficulty,dilemma,crimes, dispute,errors,conflicts 等名词搭配,故solve偏向数学、谜题、案件与日常事务领域。二、在 CLEC 中,handle常与 business,opium,things 搭配,故 handle 偏向商业、日常事务领域。Solve常与 problem,question,shortage 搭配,故solve偏向于问题解决、资源短缺领域。三、英语学习者handle与本族语的语义偏好大致一致,然而solve的语义偏好则与本族语相差甚大。四、handle 与 solve 的副词搭配的语义偏好大部分与本族语一致,均与方式副词和时间副词搭配。
BNC与CLEC中handle搭配的词与solve搭配的词两者语义韵使用情况大致相同——handle 语义韵属于积极语义韵,solve 属于消极语义韵。故可以得出英语学习者掌握handle与solve的语义韵情况较好。
五、讨论与启示
通过以上数据分析发现:英语学习者对handle与solve的使用在词频分布、语域分布、搭配行为、类联接、语义偏好上与本族语有一定差异。造成这种差异的潜在原因可能如下:1)不当教法。同义词教法不当可能原因有:因教师个人偏好统词汇教学法,将重点放在练题上从而忽略了词汇的讲解;没有足够时间备课。如果没有常见的语法上的考点,教师则直接将两个单词画上等号;没有给学生提供一定的语境去了解同义词用法上的不同。以上的教法常常导致学生将两个词不管语境等直接替换使用、只追求词汇的丰富性却忽略了表达的地道性。 2)不当学法。英语学习者在单词的记忆方面常常脱离语境等只背英文单词和对应 的中文释义,平时也没有留意同义词在搭配等上的不同,这无异于无效的输入。 3)文化差异。中国的英语学习者习惯于用中式思维方式。在英语输出时仍会受到中式思维的影响,创造出一系列的中介语。
六、结论
本研究通过 BNC 与 CLEC 语料库对处理类同义词“handle”、“solve”进行了词频分布、语域分布、搭配行为、类联接、语义偏好和语义韵上的对比。结果发现在词频上,本族语较 常使用 handle,英语学习者较常使用 solve;在搭配行为上,本族语中 handle 常与名词搭配,其次是副词,而英语学习者的使用情况则相反。同时,英语学习者使用 handle时与名词搭配的数量、种类很少;在类联结上,英语学习者常使用handle 接副词,solve接名词,而本族语中则相反;在语义偏好上,本族语中solve偏向数学、谜题、案件与日常事务领域。英语学习者则将 solve 用于问题解决、资源短缺领域。然而,本研究仍有不足。本研究是基于2003年的CLEC语料库进行检索,不能排除时效性与库容量的丰富程度能否完全的代表21世纪的学生学习情况。所以如果收集当下不同水平、相似话题的英语学习者的作文并进行建库、文本降噪等操作,使用此类语料库则能很大程度上增强本研究的效度。
【参考文献】
[1]Conzett,J.Integrating collocation into a reading and writing course[C].J.Coady & T.Huckins (eds.).Second Language Vocabulary Acquisition.Cambridge:Cambridge University Press,1997:70-87.
[2]Rundell, Michael, &P.Stocks. The corpus revolution[J]. English Today, 1992, 9:71-88.
[3]Biber, D. Conrad, S.& Reppen, R.Corpus Linguistics Foreign Language[M].Teaching and Research Press, Cambridge University Press, 2000.
[4]Kennedy, G.An Introduction to Corpus Linguistics[M].Foreign Language Teaching and Research Press, 2000.
[5]Thomas, J. Using Corpora for Language Research[M].Foreign Lan-guage Teaching and Research Press, 2001.
[6]崔薇.基于语料库的同义词辨析——对 develop、improve、advance、enhance 和 progress 的对比研究[J].新乡师范高等专科学校学报,2007,(04):104-107.
[7]霍艳娟.基于BNC语料库的同义词adapt和adjust用法辨析[J].长春师范学院学报,2014,33(01):83-87.
[8]谢艳红.基于语料库的英语同义词搭配行为对比研究——以 Gain & Obtain 为例[J].长 春理工大学学报(社会科学版),2011,24(01):70-72.
[9]霍艳娟.基于BNC语料库的近义词用法对比研究——以“event”和“affair”为例[J].长春大学学报,2013,23(10):1334-1337.
[10]任培红.同义词的教与学:以 Common 和 Ordinary 为例[J].解放军外国语学院学 报,2008,(04):57-60.
[11]林轩.英语常用同义词的语义搭配研究——以 very,rather,quite 为例的一项基于语料 库的个案研究[J].江西师范大学学报(哲学社会科学版),2011,44(02):123-126.
[12]桂诗春、杨慧中,2003,中国学习者英语语料库[M]。上海,上海外语教育出版社。