British National Corpus
British National Corpus
現代イギリス英語の代表的なコーパスの1つであるBritish National Corpusのサイトへのリンクです。さまざまなインターフェイスで検索をすることが可能ですので、まずこのサイトを見て全貌を理解した上で、検索に進むのがよいと思います。90パーセントが書きことば、10パーセントが話し言葉のデータから構成されるコーパスです。
BNCのページの冒頭部分を引用しておきます。
“The British National Corpus (BNC) is a 100 million word collection of samples of written and spoken language from a wide range of sources, designed to represent a wide cross-section of British English from the later part of the 20th century, both spoken and written. The latest edition is the BNC XML Edition, released in 2007.” (http://www.natcorp.ox.ac.uk/corpus/index.xml)
Helsinki大学のCoRDでも、コーパスの詳細について確認できます。
関連サイト
- BNC Baby
- BNC Web Indexer
- Frequency lists (Adam Kilgarriff)
- Reference Guide for the BNC
- Word frequencies (Lancaster)
British National Corpusをウェブ上で検索する場合は、ウェブコーパスのページもご覧ください。
BNC2014
BNCに基づいた研究が多数発表される中、21世紀に入ってBNCの後継ともいえるBNC2014がリリースされています。詳細は、こちらのページをご覧ください。