British National Corpus

British National Corpus

現代イギリス英語の代表的なコーパスの1つであるBritish National Corpusのサイトへのリンクです。さまざまなインターフェイスで検索をすることが可能ですので、まずこのサイトを見て全貌を理解した上で、検索に進むのがよいと思います。90パーセントが書きことば、10パーセントが話し言葉のデータから構成されるコーパスです。

BNCのページの冒頭部分を引用しておきます。

“The British National Corpus (BNC) is a 100 million word collection of samples of written and spoken language from a wide range of sources, designed to represent a wide cross-section of British English from the later part of the 20th century, both spoken and written. The latest edition is the BNC XML Edition, released in 2007.” (http://www.natcorp.ox.ac.uk/corpus/index.xml)

Helsinki大学のCoRDでも、コーパスの詳細について確認できます。

関連サイト

British National Corpusをウェブ上で検索する場合は、ウェブコーパスのページもご覧ください。

BNC2014

BNCに基づいた研究が多数発表される中、21世紀に入ってBNCの後継ともいえるBNC2014がリリースされています。詳細は、こちらのページをご覧ください。