Organismul național al limbii române

Organismul național al limbii române


Site-ul ruscorpora.ru sau corpora.yandex.ru plasat reprezentativ de locuințe moderne de marcare limba română de peste 120 de milioane. Cuvinte. Carcasa este proiectat pentru oricine este interesat într-o varietate de probleme legate de limba română: lingviști profesioniști, profesori de limbi străine, elevi și studenți, străini de învățare a limbii române.

Ce este de locuințe?

Organismul național creat de lingviști (specialiști în așa-numitul lingvistica corpus, fast-paced lingvistica modernă) pentru cercetare și învățării limbilor străine. Cele mai multe dintre principalele limbi ale lumii are deja propriul corp național (care diferă în nivelul de integralitate și procesare text științific). Este un model recunoscut, în special, National Corpus britanic (BNC) :. El sa concentrat pe multe alte clădiri moderne. Printre clădirile slave limbi reprezintă National Corpus Cehă. creat la Universitatea Charles din Praga.

locuințelor are două caracteristici importante. În primul rând, se caracterizează printr-o compoziție reprezentativă, echilibrată și text. Acest lucru înseamnă că organismul conține toate tipurile posibile de texte scrise și orale prezentate în limba (arta de diferite genuri, jurnalistice, academice, științifice, de afaceri, colocvial, dialectală, etc.), și că toate aceste texte sunt parte a corpului în măsura în care este posibil, proporțional cu ponderea lor în limba perioadei în cauză. Trebuie avut în vedere faptul că o bună reprezentare poate fi realizat doar cu o cantitate semnificativă de corp (zeci și sute de milioane de jetoane). Volumul planificat al redactorilor Corpului Național al limbii române - 200 milioane de cuvinte ..

Este mai bogată și mai variată layout-ul, cu cât valoarea științifică și educațională a carcasei. Corpul național al limbii române este utilizat în prezent patru tipuri de marcare: metatext, morfologice, de accent și semantic; În viitorul apropiat introducerea sintaxei de marcare. Sistemul de marcare este în mod constant îmbunătățit.
^

De ce avem nevoie de un organism național?

corp Razrabatyaemy Național al limbii române ar acoperi în principal, perioada de la începutul secolului al XIX la începutul secolului XXI: această perioadă este modul în care limba de epocile anterioare, și modern, în diferite variante socio-lingvistice - literare, colocvial, vernaculară, parțial dialect. Șasiul include original (netradus) operă literară (proză și teatru, în continuare, de asemenea, poezie) având semnificație culturală, și, de asemenea, de interes în ceea ce privește limba. Dar organismul național în nici un fel nu este singurul organism al limbajului literaturii. În plus față de texte literare în organism în cantități mari includ alte exemple de scris (și stadiul actual - și vorbit) limba: memorii, eseuri, jurnalism, știință populară și literatura științifică, discursuri publice, corespondență privată, jurnale, documente și așa mai departe. n.
^

Compoziția și structura carcaselor


Corpusul Național al limbii române, în conformitate cu redactorii săi, vor fi încorporate în primul rând texte care reprezintă o limbă literară românească modernă (de la începutul secolului al XIX-lea.), Dar și texte care reprezintă limba drevnerumynsky (secolele XI-XIV.) Și formele non-literare ale limbii române moderne limba: colocvial, vernacular, dialect.

Texte care reprezintă o modernă limba română literară, la rândul său, împărțit în două subcorpus largi: corpus timpurie (începutul secolului al XIX - mijlocul secolului XX) și corpul de texte moderne (XX mijloc - începutul secolului XXI).

În prezent, numai corpul de texte moderne, postat pe site-ul (a doua jumătate a anului XX - începutul secolului XXI.); plasarea de alte texte este planificată în cursul lucrărilor suplimentare.

Locuințele texte moderne. Corpus textelor de mijloc a XX - începutul secolului XXI este alcătuit din mai multe clădiri, care diferă unul de altul prin ce tipuri de texte pe care o reprezintă și ce metode de marcare aplicate acestora.

Locuințele texte paralele. Un tip special de locuințe este așa-numitul organism paralel, în care textul în traducere rusă a textului potrivit într-o altă limbă, sau, dimpotrivă, textul într-o limbă străină este mapat la traducerea în limba română. Între unitățile din textul original și tradus (în mod obișnuit - între propoziții) printr-o procedură specială de potrivire set; Acest proces se numește aliniere și textul respectiv, în aliniament.

Aliniate paralel cu corpul este un instrument important pentru cercetare (inclusiv cercetarea privind teoria și practica traducerii); acesta poate fi, de asemenea, utilizate în predarea limbilor românești și străine.

În prezent, site-ul web al Corpului Național plasat un mic corpus paralel Aliniate rusă-engleză.
^

opțiunile pentru text

Grupul de factori se referă la obiectivele textului și impactul acesteia asupra publicului. Parametrii de segmente de public, care au un impact semnificativ asupra textului, atribuit dimensiunea sa, apropierea de vorbitor și restricțiile pentru public cu privire la sex, vârstă și nivelul de educație al publicului. Pe mărimea audienței este împărțit în public (mai mult de 50 de cititori / ascultători, cu subclase de sute, mii și milioane) și privat, la rândul lor, sunt împărțite în personale (2 membri), grup mic (până la 5), ​​un grup de mijlocii (până la 20) și banda. Distanta dintre parametrul în majoritatea cazurilor, o audiență publică depersonalizat (deci care nu vorbitorul). Dacă vorbitorul / scriitorul poate descrie fiecare comunicare participant, proximitatea lor este clasificată pe o scară: o bună cunoaștere personală, cunoștințele personale, nici o cunoștință personală.

La construirea domeniului locativ adâncimea de codificare. textul afectat, nu prea important, deoarece corpul nu este o enciclopedie universală. În plus, clasificarea generală, cum ar fi CZU, este rar aplicată textului și chiar mai puțin aplicabile limbii vorbite, deoarece textul poate afecta (și, de regulă, afectează) mai multe domenii simultan. În construcția carcasei poate avea o clasificare dur, alocă, de exemplu, științele naturale și sociale, politică și economie, arte și petrecere a timpului liber, etc.
^

statistici Hull

I. Distribuția textelor și a altor tipuri de metapriznakam

articole similare