コーパス言語学
コーパス言語学の入門書等
・鷹家秀史・須賀廣『実践コーパス言語学』(桐原ユニ、1998)
・伊藤雅光『計量言語学入門』(大修館書店、2002)
・中尾浩・赤瀬川史朗・宮川進悟『コーパス言語学の技法――1. テキスト処理入門』(夏目書房、2002)
・Douglas Biber, Susan Conrad and Randi Reppen著/齊藤俊雄・他(訳)『コーパス言語学』(南雲堂、2003年)
・齊藤俊雄・中村純作・赤野一郎(編)『英語コーパス言語学 基礎と実践』改訂新版(研究社、2005年)
・大門正幸・柳朋宏『英語コーパスの初歩』(英潮社、2006年)
・石川慎一郎 『ベーシックコーパス言語学』(ひつじ書房、2012年)
コンコ―ダンサー
テキストから特定の文字列を取り出すのに便利なコンコ―ダンサーとしては、以下の2つのフリーソフトが便利です。
- 早稲田大学のLaurence Anthony先生制作のAntConc(さまざまなコーパスの検索に)
- 日本大学の塚本聡先生制作のKWIC(さまざまなコーパスの検索に)
- 日本大学の塚本聡先生制作のTreebank Search(Penn-Helsinki Parsedコーパスの検索に)
AntConc 3.4.0の使い方(Laurence Anthony先生のYouTube)
- Tutorial 1: Getting Started、Tutorial 2: Concordance Tool – Basic Features、Tutorial 3: Concordance Tool – Advanced Features、Tutorial 4: Concordance Plot Tool、Tutorial 5: File View Tool、Tutorial 6: Clusters Tool、Tutorial 7: N-Grams Tool、Tutorial 8: Collocates Tool、Tutorial 9: Word List Tool、Tutorial 10: Keyword List Tool、Tutorial 11: Working with tagged data
その他のリンク
- 正規表現(ウィキペディア)
- 正規表現をわかりやすくまとめてくれているサイトがありました
- 英語コーパス学会のサイトへのリンク
- Voyant toolsは、ウェブ上で簡単なテキスト分析をすることができるツールです
コーパスのリスト
ヘルシンキ大学のCoRDのサイトには、これまでに世界各地で構築されたさまざまなコーパスの情報が集積されています。
またBrigham Young UniversityのMark Daviesは多数の大規模コーパスを構築したことで有名で、そのコーパスのサイトは、それ自体としてコーパスのリストにもなっています。Mark Daviesのコーパスは登録をすれば、基本的にウェブ上で検索が可能なウェブコーパスです。