语料库研究前沿

语料库与语言研究

  • 基于构式语法的网络非正规语言表达理解与处理

    夏榕璟;张克亮;

    网络非正规语言表达(Network Informal Language Expression, NILE)指应用于网络中的特殊的语言形式,具有创新性强、超常规化、表达方式口语化等特点,常常导致理解上的歧义。正确理解NILE对于自然语言处理具有重要意义。构式语法认为,句子意义是构式意义和词汇意义相互作用的结果,此观点为理解和处理NILE提供了新思路。通过对NLPIR微博关注关系语料库中的20,000条微博博文及评论的分析,我们发现NILE特征主要体现在词汇层面和构式层面。在词汇层面,NILE可分为三大类、12小类;在构式层面,构式意义对词汇意义施加两种影响。最后,我们基于构式和词汇特征设计知识库结构,以实现对NILE的有效处理。

    2021年00期 1-12页 [查看摘要][在线阅读][下载 611K]
  • 语料库中的语言数据处理问题刍议

    张继东;刘萍;朱亚菲;

    本文力图进一步澄清和梳理语料库语言学的语言数据处理中的一些关键问题。问题主要涉及两个方面:一、版权背景下语料库的抽样方法对语言特征分布研究的影响;二、学习者语料库与母语者语料库在选择与对比过程中产生的具体问题,包括参照语料库的选择、语料的切分、词块的提取、索引行抽样和数据的标准化等。问题的梳理有助于提升语料库语言数据研究的信度和效度。

    2021年00期 13-24页 [查看摘要][在线阅读][下载 341K]
  • 基于语料库的翻译汉语变体多特征统计分析

    刘艳春;胡显耀;

    基于原创汉语和翻译汉语可比平衡语料库,采用“多特征统计分析模型”对73个汉语语言特征进行了分析,发现14个翻译汉语变体特征,即翻译汉语与原创汉语相比具有统计显著性、跨文体一致性和系统共现性的差异特征。翻译汉语具有与翻译英语类似的简化和显化趋势,说明这两种趋势可能是跨语言的翻译共性,但翻译汉语具有一些不同于翻译英语的特征,如语素词显著减少、成语和“是”字句显著增多等。

    2021年00期 25-36页 [查看摘要][在线阅读][下载 177K]
  • 从两款语料分析软件探讨搭配网络可视化模式建构

    戴光荣;

    语料库语言学对于“搭配”的探讨涉及面广,分析角度也比较多,但分析搭配网络的研究成果还不多见,有待深入挖掘。本文尝试从#LancsBox及TLAB-PLUS两款语料分析软件中的词汇搭配网络的可视化功能展开探讨,分析其在语言研究中的功效,试图为词语搭配及其搭配网络模式建构提供更好的参考与借鉴。

    2021年00期 37-55页 [查看摘要][在线阅读][下载 2093K]

语料库与翻译研究

  • 基于多模态语料库的英汉同传数字漏译现象研究

    刘剑;胡开宝;

    基于多模态口译语料库的研究表明,英汉同传中数字漏译现象与原文形态有较为密切的关系。当原文中出现数字串、新词或生僻词与数字伴生、原文数字破碎及数位词接连出现在长句中等情形时,译员容易出现数字漏译现象,但年代数字不容易被漏译,说明漏译与数字的记忆及转换难度相关,数字漏译是译员主动或被动地降低认知负荷、确保口译任务持续进行的策略。

    2021年00期 56-67页 [查看摘要][在线阅读][下载 1962K]
  • 国内外语料库翻译研究:回顾与展望

    单宇;白芸;范武邱;

    本文以中国知网CNKI和科学网Web of Science为数据来源,运用CiteSpace软件,对国内外1993—2020年语料库翻译应用的相关期刊文献进行总体数据分析和历时演变解析,深入考察国内外研究的变化趋势、关联原因、文献特征和地缘特征,并在此基础上提出库学研统合、多元素聚合、学科发展融合的新时期中国特色语料库翻译学延展路径,旨在挖掘发展规律、揭示研究热点、展望未来方向,以期为相关研究提供参考。研究发现,国内外发展动态同步,发展路径趋同,总体由单语视野向多语视野拓展,由微观发掘走向宏观认知,由定性思辨走向质性与量化的有机融合,语料库翻译学由语料库驱动的研究方法走向学科构架。语料库翻译研究凭借实证分析方法、科学研究理念和严密认知过程,有效提高研究结果的客观性,增强翻译研究方法的科学性,加速推进翻译“共性”与“交叉”研究进程。

    2021年00期 68-81页 [查看摘要][在线阅读][下载 1399K]
  • 基于语料库的《黄帝内经·素问》三译本风格对比研究

    潘霖;杨渝;

    本研究选取了三个具有代表性的《黄帝内经·素问》英译本自建单语可比语料库,并结合词汇参数、语义主题词、搭配网络、多维分析及多元线性回归等描写手段对三译本的翻译风格进行量化分析。研究发现:李译本和文译本在词汇参数上接近,但具体表述特征不同,倪译本则与二者区别较大;主题词和搭配分析显示三译本呈现完全不同的风格和语义建构模式;语篇多维分析结合线性回归结果表明,李译本和倪译本属相同语域,文译本则在交互性上与二者区别较大。最后,本研究结合译者身份、翻译目的和受纳端情况对以上差异成因及译介效果进行了探讨。

    2021年00期 82-98页 [查看摘要][在线阅读][下载 1797K]
  • 《狼图腾》英译本中“狼”的文化形象的再现与重构

    王晓莉;

    本文采用语料库方法,通过比较分析“狼”的搭配词在原文和译文中的异同来探讨《狼图腾》中狼的文化形象在葛浩文英译本中的再现和重构。研究表明,由于简化、隐化和省译等翻译手段的使用,原文中“狼”的搭配词在译文中发生了变化,从而对狼的文化形象的再塑造成影响。本研究指出,出版经济和译者的翻译观念是造成搭配词改动和形象转变的可能原因。

    2021年00期 99-111页 [查看摘要][在线阅读][下载 167K]

语料库与形象研究

  • 批判话语视域下的长沙国际形象建构研究

    陈天歆;许家金;

    本研究基于NOW动态英语新闻语料库,考察了近10年间海外媒体对长沙的话语表征和形象建构。研究发现海外媒体存在明显话题偏好和国别差异。海外媒体主要关注长沙的商业金融、工业科技和文体旅游三方面。其中,新加坡、美国、菲律宾媒体对长沙报道最多。新加坡对长沙的商业最感兴趣,美国更关注长沙高校的科研动态,菲律宾则聚焦于长沙的篮球赛事。海外媒体着重报道长沙经济社会发展,较少提及长沙的历史文化景观及娱乐生活。长沙可据此针对性地塑造更加丰满、更具魅力的国际形象。

    2021年00期 112-123页 [查看摘要][在线阅读][下载 488K]
  • 基于语料库的英文媒体广州城市形象探究

    任朝旺;罗嘉雯;

    本研究基于语料库批评话语分析的方法,获得了“Guangzhou”(广州)的频率以及各类搭配词的频率列表,讨论广州在大型在线语料库NOW中2010年至2020年的城市形象。对广州的动词、形容词和名词搭配词分析后发现,广州作为国际交通中心的形象深入人心;经济形象方面主要体现在商业方面,科技形象并不突出;文化形象方面,体育赛事对于广州国际文化形象有巨大的推动作用;广州的国际社会形象主要体现在政府的积极作为,而教育形象有待提升。

    2021年00期 124-134页 [查看摘要][在线阅读][下载 342K]
  • 基于语料库的2020年度中美媒体新冠肺炎疫情报道对比研究——以《中国日报》和《纽约时报》为例

    尹茜;韩子满;

    本文以2020年全年《中国日报》和《纽约时报》对新冠肺炎疫情的新闻报道为来源自建语料库,借助语料库分析软件AntConc 3.5.9和WordSmith 4.0对两文本进行关键词、搭配以及索引行分析,以揭示两报的新闻焦点、对疫情的态度以及背后所体现的两国主流媒体意识形态。研究发现:在疫情背景下,《中国日报》兼顾政治和经济发展;《纽约时报》因时值总统大选而更关注政治方面,种族歧视等社会问题凸显。从关键词“China”的搭配来看,前者强调党的领导和以人民为中心,表明国际合作意愿,重视经济社会发展,坚决反对美方无端指责;后者体现出美方指责中国抗疫不力,干预中国内政,并对包括中国在内的多国发起制裁。从关键词“virus”来看,前者使用多样且具有战斗意义的搭配词,更强调抗疫的决心;而后者更强调病毒爆发的负面影响,具有悲观色彩。

    2021年00期 135-154页 [查看摘要][在线阅读][下载 259K]
  • 《费加罗报》涉华环境污染新闻分析及中国形象研究

    曹慧;严怡佳;

    本文对77篇2007年至2016年《费加罗报》涉华环境污染新闻进行了定量分析、消息来源分析、议题内容分析、倾向性分析,并结合AntConc软件分析了《费加罗报》涉华环境污染新闻中体现的中国环境形象。根据分析,我们发现《费加罗报》塑造出的中国环境形象总体呈现出正面及负面相结合的特征,通过深入研究,本文对于改善我国在《费加罗报》呈现出的环境形象提出了进一步的建议。

    2021年00期 155-166页 [查看摘要][在线阅读][下载 549K]
  • 国际海关视野下的中国形象:《世界海关组织新闻》涉华报道话语分析

    李端阳;

    通过对《世界海关组织新闻》语料库以及涉华报道的子语料库进行主题词及语义韵分析可知,《世界海关组织新闻》涉华报道所呈现的语义韵总体上偏向积极,特别是在区域合作、环境与生物保护方面,而知识产权相关报道则偏中立,这说明中国海关在知识产权方面的国家形象构建还需要进一步提升。

    2021年00期 167-182页 [查看摘要][在线阅读][下载 212K]

语料库与文学研究

  • 基于语料库的尼·诺索夫儿童文学语言特征研究

    金玄;常颖;

    儿童文学作为一种“立人”的普世文学,具有高层次的人文艺术个性和丰富的人类学价值。苏联著名儿童文学作家尼·诺索夫的儿童文学作品曾获诸多世界儿童文学大奖,深受读者喜爱。本文基于语料库,运用文体统计学的基本研究方法,对提取出的尼·诺索夫儿童文学语言特征量化数据进行描述和推断。语言特征量化数据具体通过Editplus、SPSS、Perl语言编程以及语料库检索分析软件提取和分析。研究表明,相较于同时期俄罗斯其他儿童文学语言,尼·诺索夫的儿童文学作品语言在一定范围内更接近于儿童文学的普遍性质,但这并不意味着儿童文学作家作品的语言具有同质性。尼·诺索夫的儿童文学语言在词汇、交互性和叙事层面上具有明显的区别性特征,其语言表达形式在信息或者思想传递上更具可及性。

    2021年00期 183-199页 [查看摘要][在线阅读][下载 971K]

语言数据科学与应用学科研究

  • 信息链视域下语言数据科学与应用研究论纲

    易绵竹;

    多语言大数据已成为当代语言科学、语言技术和语言工程创新研究的基础资源,同时也是助推新一代人工智能科技发展的重要源头。首先,通过对信息链及其构成要素进行解析,简述数据驱动的语言研究新范式之基本特点。随后,通过爬梳国内外学术界对数据科学内涵与边界问题的相关论述,明晰语言数据科学的学科目标和关键问题。最后,扼要阐述语言数据科学与应用研究值得关注的论题,以期为面向智能时代的语言学跨学科研究提供启发。

    2021年00期 200-210页 [查看摘要][在线阅读][下载 1653K]

  • 征稿启事

    <正>《语料库研究前沿》由上海外国语大学语料库研究院主办,致力于推进多学科、多语种的前沿性语料库研究,主要聚焦语言学、翻译学、文学、文化等领域的语料库研究,设有“语料库与翻译研究”“语料库与语言研究”“语料库与语言技术研究”“语料库与文学文化研究”等栏目,倾力打造一个语料库综合研究的重要学术平台,建设语料库应用研究发展、数字人文研究进步和语言技术成长的主要阵地。本刊为年刊。现竭诚向学界征稿,凡有关语料库语言学研究、语料库翻译学研究、语料库文学文化研究以及语料库本体研究的稿件,我们皆真诚欢迎。

    2021年00期 211-214页 [查看摘要][在线阅读][下载 119K]
  • 下载本期数据