- 收藏
- 加入书签
基于语料库的中国形象研究综述
摘要:本文梳理了以语料库为辅助研究手段的中国形象研究成果,阐述了当下的发文现状、研究方向,并对有代表性的研究成果进行了分类。同时结合该领域研究存在的问题,提出建议。通过对当下研究现状的概述,有助于让研究者了解研究发展的脉络与趋势,为今后研究提供启示。
关键词:中国形象,语料库研究,分类综述
引言
“中国形象”研究一直是国内诸多领域研究的一个热点。胡开宝认为“中国形象是多维的”[1]。早期国内相关研究多对单一文学作品中塑造的人物形象和代表国家文化内涵的中西文化象征进行对比分析。研究多采用定性分析方法,“缺乏科学的精密度和精准度” [2],容易受到人为等诸多因素的干扰。
20世纪后叶,计算机科学与技术得到迅猛发展,基于语料库与自然语言处理的研究方法得到极大发展和推广。“中国形象”这一议题的研究内容不断演变延展细化,与时俱进,语料库的研究与“中国形象”语料数据挖掘的融合引起了学者们的研究兴趣。
一、基于语料库的中国形象研究现状
根据中国知网全文数据库的检索,在各类公开发表的学术论文、学位论文、报纸、会议论文以及图书中,基于语料库研究的,主题中包含有“中国形象”字样的共有227篇。其中期刊发文量为122篇,博士论文16篇,硕士论文68篇,重要会议论文3篇,重要报纸1篇,学术辑刊和特色期刊发文量共16篇。从图1中可以看出,国内期刊相关议题的研究可以追溯至2012年,共有7篇学术成果。黄晓燕和杨跃两位学者在《外语电化教学》上发表了“基于网络语料库Webcorp的话语历史分析”[3],为基于语料库的中国形象研究翻开了序章。到2013和2014年间,发文量分别仅有1篇。虽得益于大数据挖掘和深度学习的技术支撑,语料库研究得到了长足发展,但由于部分学者倾向投稿国外期刊以及相关技术学习的滞后,使得在此期间,国内的发文量呈现下滑的趋势。从2015年开始,基于中国形象的数据库研究发文量稳步增长,到2022年已经达到了50篇。总体看来,该议题仍是研究热点,相关研究成果也将会保持高速稳定增长的态势。此外论文涉及多项国家级、省部级和市厅级课题,其中具有代表性的课题包括西安工程大学胡伟华主持的国家社科西部项目“基于语料库的国际主流媒体中国形象动态监测与分析研究(18XYY010)”和上海外国语学院杨四平主持的国家社会科学基金项目“新时期文学海外译介与接受中的中国形象建构研究(22BZW151)”。
研究机构发文分布显示北京外国语大学占据首位,发文量达19篇之多,其后上海外国语大学和华东师范大学以发文7篇排在第二位,郑州大学、浙江工商大学和上海交通大学以6篇发文量排名第三。上述机构多为科研实力雄厚和语言学专业实力强劲的985院校,而浙江工商大学则配备有科研突出的语料库研究团队。
“中国形象的语料库”研究由于其研究主题鲜有的时代性和民族性,研究方法的创新性和实践性,近几年深受高水平学术期刊青睐。根据知网数据检索,其中有33篇论文发表在Cssci,28篇论文发表在北大核心。刊登相关研究论文的学术期刊排名如表3所示,刊载文章数量3篇及以上的期刊共有6本。排名前两位的分别是《当代外语研究》和《新闻研究导刊》,前者刊登量为7篇,后者刊登文章数为5篇。除了《新闻研究导刊》外、《东南传播》和《天津外国语大学学报》为AMI入库,其余三本期刊均为核心期刊,这为学者投稿前期的择刊准备提供一定的帮助和启示。
评价期刊优劣的重要指标之一是期刊的影响因子,而刊载论文的被引次数则是“影响因子高低的决定性因素”。[4]2019年,汪徽发表在《外语教学》上的“美国媒体对中国形象的隐喻建构研究——以‘美国退出TPP’相关报道为例”被引用了146次,排名居于首位。值得一提的是,被引文献排名前五的论文均来自核心期刊,代表着“中国形象”的数据库研究方向和水平。
二、研究内容分类
语料库最初是被认作为“一个用于语言分析的文本集合,对某一种语言、方言或者语言的某一方面具有代表性”[5],语料库甫一问世就被用于语言学实证研究中去,因此相关的研究成果亦最多。其中多数研究从认知语言学角度,借助语料库对相关文本进行话语分析,探究文本中建构中国形象的语言特征、情感趋向等。也有从传播学、社会学和翻译学角度,对相关文本中涉及中国形象的描述采用数据库分析。
(一)媒体中的中国形象研究
媒体对于中国形象的报道具有直观性和具体化,是帮助国外民众了解中国,建构中国形象的主要渠道。“中国形象”建构的媒体视角聚焦中国外交形象、经济形象等。李静着重研究了中国经济形象,她分析了英国媒体对中国经济成就的报道,并利用语料库在线分析工具Sketch Engine进行话语和情感分析。研究表明,“英国媒体对与中国对经济发展取得成就存在质疑,对中国负面形象的排斥情绪充斥整个报道”。[6] 胡开宝则“依据批评话语分析理论,从高频词、关键词、情态动词的应用和‘we’的搭配等角度,分析了中国外交话语应以文本所塑造的中国外交形象”[7]。研究揭示了,中国外交政策体现了一个负责任大国的形象,这与中国文化价值观有关。也有基于国外某一知名媒体就中国的系列报道进行语料挖掘与处理,如朱锡明撰写的“《纽约时报》涉华社论所建构的中国形象--语料库驱动的搭配研究,该研究以自建的《纽约时报》社论小型语料库China为关键词进行检索,考察该词在语料中与其他词的高频搭配和共现情况”[8],结合经济现状对语料挖掘结果进行分析,以探究报道中的意识形态立场,并基于数据库的定性研究结果和意识形态视角的定量研究,归纳出《纽约时报》社论中所塑造和呈现的中国形象。
(二)文学作品中的中国形象
相较于媒体聚光灯下的中国形象,文学作品中的中国形象更富有张力和包容度,往往能触动读者内心,起到“润物细无声”的持久影响力。文学作品中中国形象更为具像化,形象化,是某一文化现象、一类人的集合体。语料库研究有助于解析文学作品产生的时代特征、作者创作意图甚至被赋予创作色彩的“中国形象”,这为相关领域的文学研究提供实证依据。
余小梅和陈光明两位学者在“华裔美国作家哈金作品《落地》建构的中国形象——基于语料库的考察”[9]一文中,以形象学理论为支撑框架,借助语料库检索工具,针对美籍华裔流散作家哈金短篇小说集《落地》(A Good Fall)中建构的中国形象,从与”China”,”Chinese”,”Party”搭配词的语义韵和检索行为进行核心考察。研究结论显示,深受西方对中国历史刻板印象影响,哈金作为移民作家,其作品中的中国形象也未能摆脱刻板印象的桎梏。白植坪在“基于语料库的林语堂和赛珍珠作品中的中国形象对比研究”[10]一文中,自建林语堂和赛珍珠作品的语料库,使用自然语言处理工具分别从文本特征词、语义域、以及情感分析等维度对比分析了林语堂和赛珍珠作品中的中国形象,同时进一步与《时代》杂志中塑造的中国形象进行对比。研究结果表明两位作家笔下的中国形象风格迥异,各具特色。
(三)译介中的中国形象
语料库技术可以帮助分析和比较原著和译本中的中国人物形象和中国国家形象的差异,以揭示不同译者在塑造中国形象方面的差异或分析译者在运用词汇句式表达时的风格差异,以便进一步考察中国形象在翻译过程中的异化。刘岚在“基于平行语料库的《天下》古诗英译叙事研究”[11]一文中,采用定量分析研究方法,分别从文本采用标的、标示式建构和人物事件重建等维度对《天下》古诗英译本翻译叙事建构的特点进行分析。得出结论为译本中尝试塑造一个“通而不同”的中国形象。除了文学著作,政论文本译作的语料库研究也具有重要研究意义。梦雪和陈辉两位作者以2010至2018年涉及民族事务的白皮书译本为语料分析对象,分析主题词对于建构中国形象的重要意义。研究结果表明,需进一步提升和完善话语建构的自主权,注重中国形象建构的不同策略,有助于塑造更民族平等、和谐和睦的中国国家形象[12]。
三、存在的问题与建议
(一)存在问题
通过搜集整理和分析中国形象的语料库研究现状,发现存在以下三方面的问题:首先,研究对象呈现集中态势,研究范围有待延伸拓展。研究对象主要为媒体中的中国形象,对于文学作品和政治文献中的中国形象关注度不够高。政治文献展示一个国家或者政党的执政理念和方针政策,能直观体现中国政党和民族形象,其外译本在构建中国形象上发挥重要作用。对于文学作品以及译本中的中国形象的语料库研究,尤其是从历时角度去分析比较不同时代背景下文学作品中的中国形象,有助于更为清晰地了解作者和译者笔下塑造的中国形象的时代特征。同时,研究的对象国集中于欧美等大国的媒体和文学作品中,自建语料库主要来自于英语,忽视了中国形象在印度、日本、韩国等国家的构建,有必要搜集相关语料,建立非英语语料库。其次,研究的深度有待提高。根据知网上的发文量和刊载期刊的层次来看,中国形象的语料库研究取得了长足进步与发展,但多数研究仍集中于语言学视角的话语分析,从语义层面去挖掘词汇特征,以印证中国形象塑造的成功与否,没有就中国形象的当代特征、历时变化乃至构建机制进行深入细致的研究。再次,语料库工具存在不足与局限,造成语料库研究成果难以推陈出新。目前科研工作者使用的语料库检索工具主要为Wordsmith和AntConc,二者有各自的优劣势,但迭代更新的速度停滞不前,导致中国形象的语料分析研究缺乏创新。近年来,随着人工智能技术和大数据文本技术的迅猛发展,情感分析、词向量技术、语言建模等技术进入语言研究领域,传统语料库研究面临着巨大的挑战。
(二)建议
基于中国形象的语料库研究存在上述问题,笔者提出了以下建议。首先,掌握前沿语料库分析技术的专家学者一方面多刊发相关研究论文,尝试将语料库研究方法融入不同的研究领域,诸如文学、教育学、医学、法学等领域,挖掘如中国人形象(古代中国形象、女性形象、男性形象)、中国教育形象、中国医疗形象和中国司法形象等相关语料,以构建和塑造多维的中国形象。其次,研究者应努力突破现有的研究方向,如有学者已经注意到中国形象的研究新维度在语料库批评翻译研究[18],其焦点在于中国形象自塑,尤其是大量真实的时政类新闻或政治类文本。建立双语或者多语平行语料库,有效促进源语文本与目的语文本之间的分析对比,更全面地扩展研究内容、领域与研究手段。笔者同时还注意到,现有研究成果集中于中国形象的塑造和构建,而国内外受众对中国形象的认可和接受度的相关研究几乎没有。最后,语料库工具本身就是一种话语分析的手段,针对不断更新的计算机文本分析的技术,研究者应结合自身研究内容和研究目标,不断学习新的语料分析技术,只有善用工具,才能取得事半功倍的研究效果。
通过对当下中国形象的语料库研究进行系统的分类综述,有利于把握研究的历史与现状,具有科研价值和历史意义,为今后相关研究提供启示。
参考文献:
[1]胡开宝,李鑫.基于语料库的翻译与中国形象研究:内涵与意义[J].外语研究,2017,34(04):70-75.
[2]洪范.定性与定量方法的思考[J].西南师范大学学报(人文社会科学版),1988(03):65-68.
[3]黄晓英,杨跃.基于网络语料库WebCorp的话语历史分析[J].外语电化教学,2012(05):31-35.
[4]赵谦.21世纪中国国内米兰·昆德拉研究综述[J].北京航空航天大学学报(社会科学版),2017,30(04):92-97.
[5]FrancisN.Problems of assembling and computerizing large corpora[C]. Computer Corpora in English Language Research. Bergern:Norwegian Computing Centre For the Humanities,1982:8
[6]李静.语料库辅助分析英国媒体视野中的中国经济话语构建[J].外语学刊,2018(03):52-57.
[7]胡开宝,田绪军.中国外交话语英译中的中国外交形象研究——一项基于语料库的研究[J].中国外语,2018,15(06):79-88.
[8]朱锡明.《纽约时报》涉华社论所建构的中国形象——语料库驱动的搭配研究[J].云南农业大学学报(社会科学版),2012,6(05):104-108.
[9]余小梅,陈光明.华裔美国作家哈金作品《落地》建构的中国形象——基于语料库的考察[J].乐山师范学院学报,2019,34(11):33-39.
[10]白植坪.基于语料库的林语堂和赛珍珠作品中的中国形象对比研究[J].信息与电脑(理论版),2022,34(09):8-13.
[11]刘岚.基于平行语料库的《天下》古诗英译叙事研究[J].湖北函授大学学报,2017,30(14):141-143.
[12]孟雪,陈辉.国家形象的语言学建构——以中国政府民族事务白皮书英译本为例[J].阜阳师范学院学报(社会科学版),2019(01):67-71.
[13]廖国海,韩戈玲.中国形象研究的新维度:语料库批评翻译学[J].上海理工大学学报(社会科学版),2020,42(01):15-20.
基金项目:安徽省教育厅人文社科重点项目(项目名称:阿瑟·韦利英译典籍中的“中国形象”研究,项目编号:2022AH052737)。
作者信息:何燕(1983-),硕士研究生,讲师,研究方向:外国语言文学,徽文化。



京公网安备 11011302003690号