英和辞典とコーパス
英和辞典とコーパス
英和辞典と「コーパス」は、辞書の歴史の中ではまだまだ日が浅い組み合わせですが、その結びつきは非常に強いものとなっています。
コーパスとは、文書に記録された、あるいは発話された文章を、収集し、蓄積して、コンピュータに収めたデータベースです。 収集対象は新聞や雑誌の記事、演説、ニュース番組の報道、日常会話まで、実に多種多彩。その規模は年々巨大化し続けています。用例の数は、数億に上る場合も珍しくありません。 でもなぜそれが英和辞典にとって有益なのでしょうか?
膨大な数の用例を収集し分析することには、大きな利点があります。
一つには、表現や考え方を平均化して偏りをなくし、同時に、より標準的な水準へならすことができるということ。
二つ目には、データの分析に基づいて情報を割り出すため、客観的なデータが得られるということ。
特定の場面において、どのような語彙が用いられやすいか、また、ある語に対してどういった語彙がセットで用いられやすいか、などのような判断は、従来、ネイティブスピーカーの経験の蓄積によるところが大きかったと言えます。コーパスは、そうしたデータや分析結果を科学的、客観的に示すことができます。
こうした情報は辞書作成にとって要となります。この単語はどういうニュアンスで用いられるのか、どんな言葉の前後に登場するのか、どんな前置詞を伴うのか、といった情報を見出すことができるためです。もちろんコーパスそのものが用例の宝庫でもあります。
ちなみに、英和辞典で最初にコーパスを使用したのは、2003年に初版が刊行された『ウィズダム英和辞典』であるとされています。