Lingvistul Dmitry Dobrovolsky lingvisticii corpus, dificultăți de traducere și principiile organizării diferitelor clădiri
Vreau să înțeleg ce este, cum funcționează și la cine și de ce sunt necesare. Aici sunt cele trei întrebări încerc să răspund. Un caz paralel - este corpus bilingv, adică, textul original și traducerea sa în orice altă limbă, iar aceste două texte nu se află doar unul lângă altul, și trebuie să fie aliniate: unele fragmente ale originalului trebuie să fie aceeași cu fragmentele de traducere corespunzătoare. Aceasta permite folosirea corpusului paralel ca un instrument de cercetare.
În plus, într-o carcasă de aliniere paralelă trebuie să fie marcaje. Există diferite tipuri de marcare: metatext, gramaticale și semantice. Acestea sunt diferite, tag-uri, care sunt atribuite cuvinte individuale sau întreg textul în ansamblu. Ce sunt? În cazul în care textul nu este marcat la mine, eu nu pot căuta orice formă gramaticală. De exemplu, eu nu pot cere toate participiul pasiv la plural, ca și în cazul în care textul am marcat în sus, în cazul în care există tag-uri corespunzătoare, o astfel de activitate este fezabil, și eu pot rezolva unele sarcini de cercetare: să arate ca una sau alta forma gramaticală tradus în o altă limbă. Marcajul semantic - este, de asemenea, un lucru foarte interesant. De exemplu, eu cer să-mi dea toate contextele în care există o denumire de îmbrăcăminte. „Jacheta“, „camasa“, „pantaloni“ - probabil că nu prea este necesar, pentru că știm deja cum să traducă aceste cuvinte în alte limbi, dar „vestă“, «» s coat“,«haina lui,»" haina „- pentru a găsi toate cuvintele și a vedea modul în care diferite traducători lucrează în diferite contexte, este foarte interesant pentru ei, mai ales că aceste cuvinte nu sunt în nici un dicționar găsi.
Un alt corpus paralel pentru a ajuta în studiul așa-numitei Lexicon lingvospetsifichnoy, și anume cuvintele care nu au echivalent bun în alte limbi. Anterior, partea principală a limbajului lingvospetsifichnogo este intuitiv: cercetător imaginat că aici, în acest cuvânt este ceva primordial rusă sau engleză nativ. Și acum poate fi setat folosind caz: dacă un cuvânt tot timpul tradus în diferite moduri și el nu are echivalentul unei normale, aceasta înseamnă că este posibil să lingvospetsifichno.
Și, într-un mod interesant, așa că lingvospetsifichnym cuvântul românesc a fost „gârlă“. Germană par să aibă cuvinte foarte asemănătoare folosite în traducere, cum ar fi Einöde sau Kaff, dar nu e același lucru. Einöde sugerează că nu există nimic și nimeni, e gol. Un Kaff - acesta este un oras mic, unde plictisitor și rău. Dar gârlă - nu este neapărat un oraș mic, există o altă problemă, care este departe de centru, și, se pare, într-adevăr este legată de cultură. Aceasta este, în cultura germană nu este atât de important să trăiască în apropierea capitalei, deoarece orice centre culturale acolo și în alte locuri. Un spațiu rusesc, aparent, a fost inițial dispuse astfel încât ideea de depărtare de centrul lexicalized, iar cuvântul „Boondocks“, asta e despre asta.
Și ultimul lucru pe care am vrut să spun, corpus paralele ale programului nostru „corpul național al limbii române“ include nu numai germană, vorbeam astăzi sau engleză. corpusuri paralele foarte mult. Avem franceză, spaniolă, italiană, poloneză, belorumynsky, ucraineană, letonă, armeană, există chiar și un corp de mai multe limbi, atunci când unul sau celălalt text este comparat cu mai multe dintre traducerile sale în diferite limbi. Și toate acestea pot fi folosite, totul e online gratuit și ușor accesibile.