コーパス言語学
コーパス言語学の入門書等
・鷹家秀史・須賀廣『実践コーパス言語学』(桐原ユニ、1998)
・伊藤雅光『計量言語学入門』(大修館書店、2002)
・中尾浩・赤瀬川史朗・宮川進悟『コーパス言語学の技法――1. テキスト処理入門』(夏目書房、2002)
・Douglas Biber, Susan Conrad and Randi Reppen著/齊藤俊雄・他(訳)『コーパス言語学』(南雲堂、2003年)
・齊藤俊雄・中村純作・赤野一郎(編)『英語コーパス言語学 基礎と実践』改訂新版(研究社、2005年)
・大門正幸・柳朋宏『英語コーパスの初歩』(英潮社、2006年)
・石川慎一郎 『ベーシックコーパス言語学』(ひつじ書房、2012年)
コンコ―ダンサー
テキストから特定の文字列をKWIC形式で取り出すのに便利なコンコーダンサーとしては、いずれもフリーソフトで以下のようなものがあります。
- 早稲田大学のLaurence Anthony先生制作のAntConc(さまざまなコーパスの検索に)
- Lancaster大学のV. Brezina先生制作のLancsBox(さまざまなコーパスの検索に)プログラムを動かすと、ウェブ上からも代表的なコーパスを取得することができるようになっています。
- 日本大学の塚本聡先生制作のKWIC(さまざまなコーパスの検索に)
- 日本大学の塚本聡先生制作のTreebank Search(Penn-Helsinki Parsedコーパスの検索に)
テキスト分背k意に使用するコンコーダンサ全般については、ブログサイトでも紹介しています。こちらのページをご覧ください。(外部サイト、「コトバと文化のフォーラム」へのリンクになります。)
AntConc 3.4.0の使い方(Laurence Anthony先生のYouTube)
- Tutorial 1: Getting Started、Tutorial 2: Concordance Tool – Basic Features、Tutorial 3: Concordance Tool – Advanced Features、Tutorial 4: Concordance Plot Tool、Tutorial 5: File View Tool、Tutorial 6: Clusters Tool、Tutorial 7: N-Grams Tool、Tutorial 8: Collocates Tool、Tutorial 9: Word List Tool、Tutorial 10: Keyword List Tool、Tutorial 11: Working with tagged data
その他のリンク
- 正規表現(ウィキペディア)
- 正規表現をわかりやすくまとめてくれているサイトがありました
- 英語コーパス学会のサイトへのリンク
- Voyant toolsは、ウェブ上で簡単なテキスト分析をすることができるツールです
コーパスのリスト
- ヘルシンキ大学のCoRDのサイトには、これまでに世界各地で構築されたさまざまなコーパスの情報が集積されています。
- またBrigham Young UniversityのMark Daviesは多数の大規模コーパスを構築したことで有名で、そのコーパスのサイトは、それ自体としてコーパスのリストにもなっています。Mark Daviesのコーパスは登録をすれば、基本的にウェブ上で検索が可能なウェブコーパスです。
- ウェブコーパスのリストをこちらのページで作成しています。ウェブコーパスはウェブ上のインターフェイスを使用して気軽に検索できますので、レポート等のための調査に利用しやすいコーパスになっています。ただし、登録が必要なも、有料のものなどがあります。