主题报告人:外国语学院 张建华 教授
语料库就是对某一特定时期在某一特定地域社会上的书面和口头语言材料的收集。通过一个搜索引擎,用户在语料库中搜索自己想要看到的语料。举个例子,如果我们想知道abide by 这个法律英语词组的用法对不对,我们可以去google中搜索,如果有很多条匹配,那么我们可以初步认定abide 确实可以跟by搭配。而语料库与google不同,能进入语料库的语料,90%是来源于报纸、期刊、出版物等书面语料,另外10%是来源于电视报道、商务洽谈、电话录音甚至是志愿者志愿贡献的口头预料。语料库的语料在某一程度上说,比google要可靠的多。
简言之,就是一个可以电子查阅的,包含巨大信息词条的字典。但它又在多个方面有别于字典,比如:
1、字典对字和词组下定义,字典可以双语查询,字典还能提供一些其它的信息:注音、详解字义、同义反义等。语料库不能给字和词组下定义,不可以双语查询,不能提供任何有关注音、详解字义和同义反义等信息。
2、字典还可以提供字和词组的具体搭配,但这些搭配只是列举,且只代表了某一时间点之前的用法,这些搭配和用法,是经过语言学家权威认证的。语料库也可以提供字和词组的具体搭配,但它的样例却远远多于字典,由于语料库处于不停地更新之中,它所列出的样例虽然没有经过语言学家的考证,但却代表了语言发展的潮流。
3、字典的产生,是语言学家通力合作对社会上语料考证的结果,它是一个语言的标杆;语料库的产生,是语言学者对社会上流行的语料的一种收集行为,它是对语言的产生、演变和发展的记录。
语料库可以提升外语学习者的学习效果,使其外语更加地道。在这里,以British National Corpus为例,它是全世界最大的英语语料库之一,迄今已经收录了一亿条语言材料。
首先,进入其网址:http://www.natcorp.ox.ac.uk/
在检索入口(Look up)中搜索你想要了解的词或词组(输入abide by):
得到202条结果,这些结果都是来自现实中的书面和口头语料。如果想访问该语料的出处,可以点击每条语料前的蓝色字体链接。
杨百翰大学当代美语语料库
密歇根大学学术口语语料库
http://quod.lib.umich.edu/m/micase/
布朗语料库、兰卡斯特·奥斯陆/卑尔根语料库
http://helmer.aksis.uib.no/icame/newcd.html
世界各国语料库、语料库相关项目、语料库语言学网站和语料库分析软件
现代日本语书写指南
青空文库(电子图书馆)
新闻报道语料库
http://www.nichigai.co.jp/sales/corpus.html
判例检索系统
http://www.courts.go.jp/search/jhsp0010?action_id=first&hanreiSrchKbh=01
日语口语语料库
日语学习者口语语料库
http://dbms.ninjal.ac.jp/nknet/ndata
日语学习者作文及母语译文语料库
http://jpforlife.jp/regist/regist.cgi
日本、韩国和台湾大学生日语作文语料库
http://www.tufs.ac.jp/ts/personal/ijuin/koukai_datal.html
特别鸣谢: