コーパス言語学

コーパス言語学の入門書等

・鷹家秀史・須賀廣『実践コーパス言語学』(桐原ユニ、1998)
・伊藤雅光『計量言語学入門』(大修館書店、2002)
・中尾浩・赤瀬川史朗・宮川進悟『コーパス言語学の技法――1. テキスト処理入門』(夏目書房、2002)
・Douglas Biber, Susan Conrad and Randi Reppen著/齊藤俊雄・他(訳)『コーパス言語学』(南雲堂、2003年)
・齊藤俊雄・中村純作・赤野一郎(編)『英語コーパス言語学 基礎と実践』改訂新版(研究社、2005年)
・大門正幸・柳朋宏『英語コーパスの初歩』(英潮社、2006年)
・石川慎一郎 『ベーシックコーパス言語学』(ひつじ書房、2012年)

コンコ―ダンサー

 テキストから特定の文字列を取り出すのに便利なコンコ―ダンサーとしては、以下の2つのフリーソフトが便利です。

  • 早稲田大学のAnthony Laurence先生制作のAntConc(さまざまなコーパスの検索に)
  • 日本大学の塚本聡先生制作のKWIC(さまざまなコーパスの検索に)
  • 日本大学の塚本聡先生制作のTreebank Search(Penn-Helsinki Parsedコーパスの検索に)

その他のリンク 
正規表現(ウィキペディア)
英語コーパス学会のサイトへのリンク

コーパスのリスト

ヘルシンキ大学のCoRDのサイトには、これまでに世界各地で構築されたさまざまなコーパスの情報が集積されています。

またBrigham Young UniversityのMark Daviesは多数の大規模コーパスを構築したことで有名で、そのコーパスのサイトは、それ自体としてコーパスのリストにもなっています。Mark Daviesのコーパスは登録をすれば、基本的にウェブ上で検索が可能なウェブコーパスです。