まず覚える表現
the corpus of someone's work
〜の作品集
学習ポイント
まず覚える表現
the corpus of someone's work
〜の作品集
覚え方
corpus = 体 → 集合体
ラテン語の『体』が原義。『一つの体のようにまとまった集成』と覚えると、作品全集にもデータ集にも応用できます。
あるテーマや人物に関する作品・文書・データなどをまとめた大きなコレクションを表すかたい語です。文学全集、論文の集まり、言語データなどに使われます。
Scholars studied the entire corpus of the author's work.
学者たちはその作家の作品集全体を研究した。
言語学・自然言語処理で、研究や辞書・AIの学習のために集められた、大量の実際の文章・会話のデータベースを指します。
The dictionary is based on a corpus of more than one billion words.
その辞書は10億語を超えるコーパスに基づいている。
ラテン語『体』の原義を残した、解剖学・医学用語。corpus callosum(脳梁)など、体や臓器の特定部分の名前に使われます。
The corpus callosum connects the two halves of the brain.
脳梁は脳の左右の半球をつないでいる。
Her doctoral thesis examined the entire corpus of Shakespeare's plays.
彼女の博士論文はシェイクスピアの戯曲全集を検討した。
Linguists use a corpus to study how words are really used today.
言語学者は、語が実際にどう使われているかを調べるためにコーパスを使う。
Modern language models are trained on a huge corpus of text.
現代の言語モデルは巨大なテキストコーパスで訓練される。
Damage to the corpus callosum can affect coordination.
脳梁の損傷は協調動作に影響を与えうる。
ラテン語起源の語で、複数形は corpora(コーパラ)。corpuses も使われますが、学術文ではほぼ corpora が標準です。
言語学・AI・自然言語処理の文脈で、訓練用や研究用の大量テキストを corpus と呼ぶのが定着しています。
『〜の作品全集』は the corpus of someone's work / the entire corpus of ... の形が定番です。
発音は /ˈkɔːrpəs/(コーパス)。最後の -us は弱く /əs/ になります。
〜の作品集
Critics still debate the corpus of her work decades after her death.
批評家たちは彼女の死後数十年経っても、その作品集について議論を続けている。
テキストの集成、テキストコーパス
The team built a corpus of texts from 19th-century newspapers.
そのチームは19世紀の新聞のテキストコーパスを構築した。
(AI の)訓練用コーパス
The training corpus contained many languages.
その訓練コーパスには多くの言語が含まれていた。
コーパス言語学
Corpus linguistics has changed how dictionaries are made.
コーパス言語学は辞書の作り方を変えた。
corpus : 体、身体
ラテン語 corpus(体)から英語にそのまま入った語。同じ語族には corporal(身体の)、corporate(法人の、肉体の集まりとしての)、corpse(死体)があり、いずれも『体』『集合体』のイメージを共有します。
名詞 / コーパスたち(複数形)
corpus のラテン語式複数形。学術論文で頻出。
形容詞 / 肉体の、身体の
corpus と同じ語源の関連語。
形容詞 / 法人の、企業の
元は『体としてまとまった』の意味で、同じ語源 corp。
ラテン語の『体』が原義。『一つの体のようにまとまった集成』と覚えると、作品全集にもデータ集にも応用できます。
現代のAI英語に頻出する training corpus(学習用テキスト)からアプローチすると、現代的な意味がすぐ身につきます。
A team of researchers spent three years building a corpus of letters written by women in the 19th century. They scanned old papers, typed each line carefully, and added notes about the writers. The corpus contained more than two million words. With this corpus, historians could see how women had really expressed their thoughts, far beyond what famous novels showed. Universities around the world began using the corpus, and new books about that era soon followed.
ある研究チームは、19世紀に女性たちが書いた手紙のコーパスを作るのに3年を費やした。彼女らは古い紙をスキャンし、一行ずつ慎重に入力し、書き手についての注釈を加えた。そのコーパスは200万語以上を含んでいた。このコーパスのおかげで、歴史家たちは有名な小説に描かれた以上に、女性たちが本当はどう自分の考えを表現していたかを見ることができた。世界中の大学がこのコーパスを使い始め、その時代についての新しい本が次々と生まれた。
アルファベット順の索引から、前後の単語やほかの単語も確認できます。
意味、例文、使い方などで気づいた点があれば送れます。