您好,欢迎来到知库网。
搜索
您的当前位置:首页网络语料库索引行信息在外语教学中的应用

网络语料库索引行信息在外语教学中的应用

来源:知库网
图书馆理论与实践 信息管理与信息学 2010(6) ●赵晓l临(东华大学外语学院,上海201620) 网络语料库索引行信息在外语教学中的应用 [关键词]语料库;索引行;语义特 1 索引行信息与外语课堂教学 征;外语教学 在语言研究的核心问题上,Sinclair[2 提出的语 [摘要]探讨中国外语教师如何分析 料库语言学与Chomsky的转换生成语言学和Halliday 网络语料库数据,并将研究成果引入课堂 的功能语言学有着很大不同。Chomsky转换生成语法 教学。语料库索引行信息可以用于探讨本 的哲学基础是二元论,他将语言分为语言系统com— 族语者的真实语言使用,也可以对比分析 petence)和语言应用(performance),仅关注语言系统 中英文的异同。 的研究;Halliday功能语法的哲学基础是一元论,他 [中图分类号]G64;H3 认为语言具有社会性,因而语言研究的对象应该是在 [文献标志码]B 社会语境中实际使用的语言。虽然二者研究语言的哲 [文章编号]1005—82l4(201O)06—0035—03 学基础不同,但他们研究的语言关系却是相同的,即 语言的聚合关系,譬如Chomsky树形图中可作为NP 20世纪80年代John Sinclair在英国伯明翰大学创 的成分,如We,they,I等之间存在聚合(paradigmat— 建英语语料库(Bank of English,以下简称BoE),开 ic)关系,Halliday的主位结构理论中可充当主位或述 创了具有性的由语料库数据驱动编撰词典的时 位的成分之间也存在聚合关系。而以Sinclair为代表 代。30年后的今天,除了词典编撰外,语料库语言学 的语料库语言学家聚焦于真实语言,他们的研究基 研究在其他领域也硕果累累,如语料库数据驱动研究 于大量的真实数据,以复现的语言形式、意义及其 英语本族语者的语言特征、基于语料库探讨外语学习 内在规律为研究内容,归纳、概括和描述形式选择 者的中介语特征、建立平行语料库进行双语对比研究 和意义实现的机制。E3]语料库语言学家重视语言的 等等。基于大数据的语料库语言学研究成果揭示出许 组合(syntagrnatic)关系,认为一个词的意义存在于 多已有语言学理论中未提及的真实语言的使用特征, 它的结伴关系中。E4]他们认为,语言的组合关系更能 如词汇搭配的语义特征、语言使用的短语学特征,[1] 反映真实语言中各成分之间的关系;同时,语言的组 等等。今天“语料库语言学”这一术语似乎家喻户 合关系又体现了形式与意义一体的语言内在机制。为 晓,然而令人遗憾的是,该领域的许多研究成果并没 说明问题,我们在CCS语料库中检索了GET v—ed 有被充分理解,许多重要发现和最新进展没有应用到 (动词过去分词)型式,可以看到4O行随机索引行。 语言教学中。近年来中英文在线语料库不断涌现,它 由于版面有限,我们在表1中仅列出l0行随机索 们为外语教师提供了丰富的真实文本语料,充分利用 引行。 在线语料库资源值得外语教学界研究。 本文将探讨外语教师如何提取网络语. 查 !! 兰 !竺兰三:二竺竺竺 查!!竺 料库数据,如何分析数据并将结果用 于课堂教学。本文讨论的语料库数据 主要来源于克林斯在线英语索引行抽 样语料库(Corpus Concordance Sampler, 以下简称CCS),英国伯明翰大学由远 程登录的BoE,以及北京大学汉语语 言学研究中心的网络汉语语料库(以 下简称CCL)。 ・35・ 图书馆理论与实践 信息管理与信息学 2010(6) 索引行信息可以为教师提供课堂教学使用的真实 个索引行中GET v—ed都含有主语被动行事的意义, 文本资料。首先,教师可以根据讲课需要自行检索词 这类动词过去分词搭配词约占搭配词总数的50%,如 或型式(pattern)。索引行是以某个词或某个型式为对 “…you were going to blow him up when you got coked to the 象的检索结果,如表1是对GET v—ed型式的索引行 gills on you heroin!”。再次,我们在B0E中检索上述 检索结果,它提供检索对象的组合关系信息,即动词 GET v—ed型式,可以按照频数及互信息值M1分别检 GET与动词过去分词搭配词的搭配信息。其次,教师 索,用以检验CCS的检索结果。按照频数提取的搭配 可以将索引行结果直接用于课堂教学,也可以将结果 词,频数越高,说明它与GET共现的次数越多;MI 作为学生自主学习的材料,由他们总结GET v—ed的 值则提供两个词之间搭配力强弱的信息。MI为正值, 语用特征。我们下面将深人探讨外语教师如何将表1 说明二词之间存在相互吸引。MI值越大,二词共现的 所示的索引行检索结果用于课堂教学,启发学生掌握 概率越高,故搭配力越强;反之,MI值越小,搭配力 语言的组合关系。 越弱。虽然按照MI值提取的搭配词可能包含语料库 2索引行信息与词汇意义研究 中词频很低的词,但是它是反映短语中二词间联系的 近年来基于大数量真实数据分析的语料库语言学 紧密程度的有用指标。结果发现在BoE有12313 研究成果证实,自然语言中存在大量重复使用的词汇 索引行,频数值和互信息值排在前20位的动词过去 搭配。研究表明,大多数日常词汇没有的意义, 分词搭配词检索结果如表2所示。 它们形成的多词型式(multi—word patterns)构成了文 本的重要组成部分。_2 Jlos一方面,词汇和其搭配词之 袁2 BoE中GET的右1动词过去分词搭配词 间相互依赖,所以在本族语使用的语言中,某些词高 (a)按共现频数排序 (b)按MI值排序 频共现,极端例子如kith,它只出现在短语kithandkin l involved1235 Il fed 161 l birched 12.32 l1married l 0.72 2 married l162 l2 bored 141 2 reaequaintedl2.06 12hogged 10.64 中。另一方面,更为重要的是,词汇搭配与意义密切 3 used 602 13 hurt 140 3 sidetracked 1 1.36 13psyched 10.58 联系,词的意义因其高频共现的搭配词不同有所差 4 paid 470 14 elected 118 4 slagged 11.15 14bored 10.45 5 call2 t 358 15 called 88 5 wayliad 11.10 15nabbed 10.45 异,而与某个词高频共现的搭配词往往形成一定的语 6 done 246 16 hit 88 6 acquaintde 10.92 16mopped 10.4l 义趋向(semantic preference),从而具有一定的语义韵 7 lost 233 17 mixed 87 7 fobbed 10.84 17lumbered 10.25 8 started 201 l8 excited 82 8 caned 10.82 I8sllc haI ed IO.21 (semantic prosody)。Sinclair¨ 将搭配(collocation)、 9 stuck 198 19 interested81 9 mugged 10.79 19re--elected 10.17 类连接(colligation)、语义趋向、语义韵及其之间的 lOkilled l67 20 CONfused 80 lOclobbered 10.79 20booted 1 o.15 相互关联性称为扩展意义单位(extended unit of mean— 按照对表1索引行信息的处理方法分析表2数 ing)。Sinclair的研究方法是从语料库数据出发,根据 据,表2中的频数和MI值数据说明,GET与具有消 上述几个方面归纳总结出词或型式的意义。我们仍然 极语义特征和中性语义特征的动词过去分词搭配力非 以GET v—ed的随机索引行信息为例分析。对GET 常强。观察其语境意义也表明,GET v—ed具有消极和 v—ed的40行索引行数据分析时,教师可以引导学生 中性语义特征。 按以下步骤归纳该型式的意义。首先,整理语料库数 综上所述,词的意义不仅指传统上的“词典意 据。去除含有非动词过去分词搭配词的索引行,如 义”,还应当包括与该词有着组合关系的搭配词的意 got used to和got printed menus共3行索引行。其次, 义,以及搭配词所产生的语义趋向和语义韵,或语义 分析GET的动词过去分词搭配词的语义特征。GET的 特征,即积极、消极或中性语义特征。语料库语言学 37个动词过去分词搭配词中有l5个具有明显的消极 强调观察的重要性,它以词汇为研究的出发点,探讨 语义特征,如kicked,teased,bored,fired,fedup, 词汇为中心的词汇一语法(1exico—grammar),探讨词 disappointed,blocked,caught,wound,hurt,side— 汇与语法的组合,以及词汇一语法与意义和功能的密 Racked,frustrated,forced,roped,这些词占搭配词总数 切关系。对于中国学习者而言,词汇知识是他们学习 的40.5%;GET的动词过去分词搭配词中仅有excited 的基础,也是他们使用英语的难点。中国学习者往往 一个具有明显积极语义特征,占搭配词总数的2.7%; 以为掌握了英语词汇,但是在与其他词搭配使用时却 其余21个动词过去分词搭配词本身虽然无明显语义 常常与英语本族语者的用法相去甚远。中国学习者需要 特征,但是观察它们的语境意义却发现,除了包含 更多地了解英语本族语者的高频搭配信息,网络语料 get started和getmarried的共计4个索引行外,其它l7 库索引行检索在今天的英语教学中可以发挥重要作用。 ・36- 图书馆理论与实践 3索引行信息与英汉词汇意义对比研究 信息管理与信息学 2010(6) 索引行,并比较这些索引行中检索词的搭配词及其使 用语境,使学生对它们的语义特征的差异有更加深刻 的认识。 对中国学习者而言,词汇之间的搭配使用是英语 学习的难点之一。由于所蕴含的文化背景知识不同, 英文和中文之间存在很大的语义趋向上的差异,这一 点也给外语教师的课堂教学带来了困难。英汉语料库 的索引行信息对比,可以为外语教学提供大量语言差 异方面的信息。譬如教师可以提取同义词或短语的索 引行,分析搭配词的语义特征为学生讲解意义差异。 表4 BoE中 'problem”的随机索引行 obvious.Ministers acknowledged the problem seven months later,when full hem?Whatt do I THINK caused the problem[Pl【P】【h]What do I think can in he tGuffhad complicated the problem.Hesaidhiscountry,whichisdue which have not yet encountered he problem sthould commence immediate 我们下面以英语同义词completely和utterly为例分析 索引行数据如何应用于课堂教学。在CCS语料库中分 别检索与上述两个副词与形容词搭配的索引行,com— pletely的形容词搭配词有:new,free,diferent,f0卜 eign,true,automatic,pleasurable,separate,harmless, unconscious,unresponsive等,搭配词中既有褒义词, 也有贬义词和中性词;utterly的形容词搭配词中绝大 部分具有消极语义特征,如inexcusable,ridiculous, impossible,bare,unfamiliar,miserable,wrong,ruth— less等。因此,尽管completely和utterly都对应中文 “完全地”,但两词的形容词搭配词却反映出它们具有 不同的语义特征。utterly吸引具有消极语义特征的词 汇,所以它高频与贬义词搭配使用;而completely与 积极、消极和中性语义特征的词都可搭配使用,语境 意义相对复杂。 如何用英文表达中文的“问题”也常常给中国学 习者带来问题。我们在CCL中检索“问题”,可以得 到表3所示的索引行。 表3 CCL中“问题”的随机索引行 仇章算术)中。在第八章“方程”中,第一个哩是计算粮食问题:“今有上禾三秉,中禾 方程,得到的未知数值称为方程的解。许多实际E湮都可以归结为解方程问题,这使得方程用 最高幂数,称为方程的幂次。在用方程解决实际 遁时,首要的是设未知数,然后根据条件列 纪,中国的涨丘建算缈中有一道著名的百鸡 邀:“百元买鸡百只I,j、鸡l元3只坶鸡3 他让两个资格、职位相同的候选人解答下面这个l煎,谁先答出就提拔谁。——“有人在林中散 着人类社会实践活动的增加,需要研究各种运动回题,E9对运动物体的数量关系若 刻划,这就 们同时从两地起飞,几天后相遇?这个有趣的l 出自中国古代数学名著仇章算术》,书 我们的祖先是用比例方法解决这个 的,他们充分认识了比、分效、除数的相 中文的“问题”和英语的‘"problem”对等吗?我 们在BoE中检索了‘problem”,结果如表4所示。 观察表3中“问题”和表4中‘'problem”的语境 不难看出,中文的“问题”比英文中的‘p"roblem”语 义宽泛,中文的“问题”可以意同英文的‘p"roblem”, 指“困难之事”,也可以指话题或议题,即意同英文 的“topic”或‘ ̄ssue”。所以,作为如何表达中文“问 题”的课堂材料,教师应当检索至少上述3个单词的 hte selectcommitteehasexposedthe problem.NowitisuptotheGovernmentto solving;wehaveidentiifedthe problem;weknowhowtheproblemcanbe Theythoughttheyhad solvedthe problem,but1wantdetoshowthemthe to6x4inch.S0 I’ve solvedthe problem byhaving selectivelycmpped 4结语 作为经验主义学派,语料库语言学探讨实际生活 中真实的语言。语料库不仅为外语教师提供课堂教学 素材,也为中国学习者自主学习提供参考。利用网络 语料库的索引行信息,一方面,外语教师可以引导学 生归纳检索词或型式的常用搭配,讨论搭配词的语义 特征,从而更好地理解检索对象的意义及其用法;另 一方面,外语教师也可以引导学生对比英语索引行和 中文索引行的差异,总结中英文用词乃至谋篇方略的 异同。总而言之,如果外语教师更多地将本族语者的 真实语料引入课堂教学,必将对中国学习者习得并表 达自然、贴切的语言起到很好的作用。 [参考文献] [1]赵晓临,殷耀.语料库研究的课堂教学价值—— 评《从语料库岛课堂:语言使用和语言教学》 [J].外语界,2009(3):88—92. [2]Sinclair J.Corpus,Concordance,Collocation[M]. Oxford:Oxford University Press,1991. [3]卫乃兴.JohnSinclair的语言学遗产——其思想与 方法评述[J].外国语,2007(4):14—19. [43 Firth J R.Papers in Linguistics 1934—1951 lM J. London:Oxford University Press,1957. [5]SinclairJ.Trust the text:Language,Corpus and Discourse [M].London:Routledge,2004. [作者简介]赵晓临,女,西安市人,东华大学外语 学院副教授,上海交通大学博士研究生,研究方向: 语料库语言学、中介语对比研究。 [收稿日期]20l0—03—09 [责任编辑]邵晋蓉 ・37・ 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- zicool.com 版权所有 湘ICP备2023022495号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务