Open American National Corpus

Open American National Corpusは、1500万語の現代アメリカ英語のコーパスです。 コーパスのサイトに “The Open American National Corpus (OANC) is a massive electronic collection of American English, including texts of all genres and transcripts of spoken data produced from 1990 onward. All data and annotations are fully open and unrestricted for any use”と書かれているように、データの公開を前提としたプロジェクトです。

50万語を抽出したMASCもこのサイトから入手可能です。