Szófaj: főnév
Jelentése:
- Egy nagy mennyiségű írott vagy beszélt anyag gyűjteménye, amelyet általában nyelvészeti vagy filológiai elemzés céljából gyűjtenek össze.
- Orvostudományban a „corpus” egyaránt jelentheti a testet vagy egy szerv nagy részét.
Források:
www.dictionary.com
Jelentése példamondatokkal
- A nyelvészek egy nagy angol nyelvű corpus-t vizsgáltak, hogy megértsék az új szavak terjedését.
- Az anatómiában az agy corpus callosum-ja az agyféltekék közötti kapcsolat fő helye.
Eredete
A „corpus” szó a latin nyelvből származik, ahol eredetileg „test” vagy „szöveg” jelentéssel bírt. Az ókori latinban a „corpus” jelenthette mind az emberi testet, mind pedig egy írott mű vagy szövegtest összességét.
Történeti és kulturális vonatkozás
A corpusok használata különösen fontos a modern nyelvészetben és digitális eszközök fejlesztésében, ahol a természetes nyelvi feldolgozás (NLP) eszközeihez alapvetőek. Emellett az orvosi terminológiában a „corpus” különböző szervek részeire utal, ami az anatómiai ismeretek alapja már az ókori római és görög orvosok idejétől kezdve.
Gyakori tévhitek és helytelen használat
A „corpus” szót sokan helytelenül használják kizárólag az emberi test leírására, pedig az jelenthet bármilyen szöveggyűjteményt vagy adatcsoportot is, különösen a nyelvészeti és számítógépes adatfeldolgozás területén. Valamint, néha összekeverik a „corpus” szót a „corps”-szal, ami katonai egységet jelent.
Összehasonlítás és kontraszt
A „corpus” különbözik az „archive” szótól abban, hogy míg mindkettő gyűjteményt jelent, a „corpus” kifejezetten a nyelvészeti vagy speciális célú adatok gyűjteményére utal, míg az „archive” bármilyen gyűjtemény lehet, amely történelmi vagy fontos adatokat tartalmaz.
Példák összehasonlításra:
- Egy irodalmi corpus lehet William Shakespeare teljes műveinek gyűjteménye, míg egy archívum egy könyvtár régi újságcikkeit tartalmazhatja.
Szó család és rokon értelmű kifejezések:
- „Corporeal” (testi), „corporate” (vállalati), „incorporate” (magába foglal)
Szinonimák:
- Gyűjtemény, halmaz, anyagállomány
Ellentéte
- Hiány, elkülönülés, üresség
A „corpus” jelentése és használata
Gyakorlati használat különböző kontextusokban
A „corpus” kifejezés a magyar nyelvben elsősorban irodalmi vagy nyelvészeti összefüggésben jelenik meg, és azt a gyűjteményt jelenti, amely írott vagy beszélt nyelvi anyagokból áll. Az ilyen gyűjteményeket gyakran használják a nyelvészeti kutatásokban a nyelv használatának vizsgálatára. Például, egy nyelvészeti corpus tartalmazhat újságcikkeket, könyveket, interjúkat, stb., és ezek alapján elemezhetők a nyelvi mintázatok, szóhasználatok.
A számítógépes nyelvészetben a corpusok alapvető eszközei a természetes nyelv feldolgozásának (NLP), ahol algoritmusok segítségével lehet elemezni és megérteni a nyelv szerkezetét és működését.
A „corpus” kifejezés használata más területeken is előfordulhat, például az orvostudományban is használják, ahol a latin szótő eredeti jelentése – test – alapján emberi vagy állati testrészekről beszélnek.
Érdekesség:
Érdekes tény, hogy a „corpus” szó latin eredetű, és eredeti jelentése „test” vagy „testtömeg”. Az angol és más nyelvek, mint a magyar, átvették a szót, és kibővítették a jelentését, hogy a szavak vagy szövegek gyűjteményére is vonatkozhasson. Továbbá, a jogi nyelvben is találkozhatunk a „corpus delicti” kifejezéssel, amely a bűncselekmény fizikai bizonyítékára utal.