校内镜像: http://10.15.61.172/ldc/LDC.html ,目前有2017-2020年的部分资源,陆续更新中。
注意:
近期发现有同学将账号借给校外人员使用,一经发现LDC将永久禁止该账号使用。
近期有用户使用工具检索下载数据,导致LDC服务器停机,严重影响了其他机构用户的正常使用,我们也收到了来自LDC的警告邮件。请用户合理使用数字资源,否则影响后续资源的续订和使用。
LDC(Linguistic Data Consortium,语言数据联盟)语料库包括阿拉伯语、汉语和英语新闻文本、布朗语料库全文、来自交换机与费舍库(Fisher Collection)数以百万计的英语电话语音以及美国英语口语词汇。LDC的数据版权年自1993年起,每年增加30-36个新的资源。
LDC是会员制联盟,会员包括全球高校、研究室、政府相关单位等。浙江大学已是会员。自2017年起,图书馆开始订购其会员年数据。本校师生或某些部门也订购过2017年之前的部分会员年数据和非会员年数据,这些数据都对本校师生免费开放。
目前可访问的数据为以下会员年数据:2009(Standard)、2011(Standard)、2016(Standard)、2017(Subscription)至今的数据,以及部分已付费的非会员年数据(Non Membership Years)。Standard表示“有权访问会员年的16个语料库以及LDC在线资源”。Subscription表示“有权下载会员年指定的30-36个语料库,有权访问LDC在线资源”。
除此之外的数据,如有需要须自行付费。
图书馆还订购了BYU语料库。
【注意事项】
1、注册需使用zju邮箱,且Organization处必须选择Zhejiang University,否则无法过审;
2、注册后,请以【LDC注册审核_您的注册邮箱】为主题,内容包含学工号,发送邮件至zju_dig@zju.edu.cn,注册人经核实为在职在校,将审核通过。