Pagrindinės mašininio vertimo klaidų rūšys. Kaip mokslinė disciplina

58. Retsker Ya.I. Apie reguliarius susirašinėjimus verčiant į gimtoji kalba// Mokomojo vertimo teorija ir metodika. – M., 1950. S.

59. Retsker Ya.I. Vertimo teorija ir vertimo praktika. – M., 1974 m

60. Semenova M.Yu. Teksto vertimo pagrindai. – M., 2009 m

61. Strelkovskis G.M. Karinio vertimo teorija ir praktika. – M., 1979 m

62. Ter-Minasova S. G. Kalba ir tarpkultūrinė komunikacija. – M.. 2000 m

63. Tyulenev S.V. Vertimo teorija. - M.: Gardariki, 2004 m

64. Fiodorovas A.V. Bendrosios vertimo teorijos pagrindai. – Sankt Peterburgas, 2002 m

65. Florin S., Vlahov S. Neverčiamas vertimu. – M., 1980 m

66. Khaleeva I.I. Mokymosi suprasti užsienio kalbos kalbą teorijos pagrindai (vertėjų mokymas). – M., 1989 m

67. Chomsky N. Kalba ir mąstymas. – M., 1972 m

68. Černovas G.V. Sinchroninio vertimo teorija ir praktika. – M., 1978 m

69. Chužakinas A., Palažčenko P. Vertimo pasaulis, arba amžinas tarpusavio supratimo ieškojimas. M., 1997 - 2004 m

70. Čukovskis K.I. Aukštasis menas. – M., 1968 m.

71. Schweitzer A.D. Vertimo teorija (būsena, problemos, aspektai). M., 1998 m

72. Schweitzer A. D. Vertimas ir kalbotyra. – M., 1973 m.

73. Shiryaev A.F. Vertimas kaip sudėtingų mokslinių tyrimų objektas // Lingvistinės vertimo problemos. – M., 1981 m.

74. Širjajevas A.F. Sinchroninio vertimo vadovas. – M., 1982 m.

75. Širjajevas A.F. Vertimo teorija. Būsena. Problemos, aspektai. M., 1988 m

76. Šadrino V.I. teorija greitaišiuolaikinėje vertimo studijoje // XXVІІІ tarpuniversitetinės dėstytojų ir magistrantų mokslinės metodinės konferencijos medžiaga. t. 5. Einamieji klausimai vertimo teorija ir praktika. 1999 kovo 15-22 Sankt Peterburgas, 1999 m.

Alys shetelde shykkan adebietter:

1. Bassnett-McGuire S. Vertimo studijos. - Methuen, L. ir N.-Y., 1980 m.

2. Brislin R.W. (red.). Vertimas. Taikymas ir tyrimai. - N.-Y., 1976 m.

3. Broeris R. (red.). Apie vertimą. - Kembridžas (Masas), 1959 m.

5. Catford J. Lingvistinė vertimo teorija. - L., 1965 m.

6. Coseriu E. Teoria del lenguaje y lingliistica general. Cinco estudias. – Madridas, 1973 m.

7. Dolet E. De la manie’re de bien traduire d’une langue en l’autre. – P., 1540 m

8. Delisle J. L’analyse du discourse comme methode de traduction. – Otava, 1984 m

9. Dryden J. Ovid's Episteles // W.P.Ker (red.) Essays of John Dryden – Oksfordas, 1926 m.

10. Firth J.R. Lingvistinė analizė ir vertimas // Romanui Jakobsonui. - Haga, 1956 m.

11. Goethe J.W. Drei Stucke vom Übersetzen // H.J.Storig (Hrsg.). Das Problem des Übersetzen. – Štutgartas, 1963 m.

12. Gutt E.-A. Vertimas ir aktualumas. Pažinimas ir kontekstas. - Kembridžas (Masas), 1991 m.

13. Güttingeris F. Zielsprache. Teorija ir technika des Übersetzens. - Ciurichas, 1963 m.

14. Halliday M.A.K. Palyginimas ir vertimas // M.A.K. Halliday, A. McClntosh, P. Strevens. Kalbos mokslai ir kalbų mokymas. - L., 1964 m.

15. Halliday M.A.K. Kalbų palyginimas // A.Mclntosh, M.A.K.

16. Halliday. Kalbos modeliai. L., 1966 m.

17. Holz-Mänttäri J. Transtatorisches Handeln. Teorija ir metodas. – Helsinkis, 1964 m.

18. Humboldt, W. Einleitung zu „Agamemnon“ // H.J. Störig (Hrsg.). Das Problem des Übersetzens. – Štutgartas, 1963 m.

19. Jäger G. Translation und Translationslinguistik. - Halė (Saale), 1975 m.

20. Jäger G., Müller D. Kommunikative und maximale Äquivalenz von Texten

// Äquivalenz bei der Translation. – Leipcigas, 1982 m.

21. Jäger G. Die sprachlichen Bedeutungen - das zentrale Problem bei der Translation und ihrer wissenschaftlichen Beschreibung // Bedeuting und Translation. Leipcigas, 1986 m.

22. Jakobsonas R. Apie kalbinius vertimo aspektus // R. Brower (red.). Apie vertimą. - Kembridžas (Masas), 1959 m.

23. Kade O. Zufall und Gezetzmassigkeit in der Übersetzung. – Leipcigas, 1968 m.

24. Kade O. Die Sprachmittling als gesellschaftliche Erscheinung und Gegenstand wissenschaftlicher Untersuchung. – Leipcigas, 1980 m.

25. Kelletat A.F. Die Ruckschritte der Übersetzungstheorie. - Vaasa, 1986 m.

26. Koller W. Einfürung in die Übersetzungswissenschaft // 6. Auflage. Wiebelsheim, 2001 m

27. Krings H.P. Buvo Kopfen von Übersetzern vorgeht. - Tiubingenas, 1986 m.

28. Lederer, M. La traduction simultanée. Patirtis ir teorija. – Paryžius, 1981 m.

29. Liuteris M. Sendbrief vom Dolmetschen // H.J.Störig (Hrsg.). Das Problem des Übersetzens. – Štutgartas, 1963 m.

30. Liudskanovas A. Prevezhdat chovekt i mashinata. – Sofija, 1957 m.

31. Mounin S. Les Problèmes théoriques de la traduction. – Paryžius, 1963 m.

32. Mounin G. Teoria et storia, della traduzione. – Turinas, 1965 m.

33. Mounin G. Linguistique et traduction. - Briuselis, 1976 m.

34. Neubert A. Pragmatische Aspekte der Übersetzung // A. Neubert (Hrsg.).

Grundfragen der Übersetzungswissenschaft. – Leipcigas, 1968 m.

35. Neubert A. Tekstas ir vertimas. – Leipcigas, 1985 m.

37. Nida E. Biblijos vertimo pavyzdžiais išreikšti vertimo principai. // R. Broperis (red.) Apie vertimą. - Kembridžas (Masas), 1959 m.

38. Nida E. Vertimo mokslo link. – Leidenas, 1964 m

39. Nida E., Taber C.R. Vertimo teorija ir praktika. – Leidenas, 1964 m.

40. Nida E, Reyburn W.D. Reikšmė įvairiose kultūrose. – NY., 1976 m.

41. Quine W. Reikšmė ir vertimas. // R. Brower (red.) Apie vertimą. – Kembridžas (Masas), 1959 m.

42. Reiss K. Möglichkeiten und Grenzen der Übersetzungskritik. – Miunchenas, 1971 m.

43. Reiss K.. Vermeer H.J. Grundlegung einer allgermeinen Vertimų teorija. Tubingenas, 1984 m.

44. Rose M.D. (red.). Vertimo spektras. Esė teorijoje ir praktikoje. - Olbanis, 1981 m.

45. Ross C.D. Vertimas ir panašumas // M.D.Rose (red.) Translation Spectrum. - Olbanis, 1981 m.

46. ​​Savory T. Vertimo menas. - L., 1952 m.

47. Schleiermacher F. Methoden des Übersetzens // H.J.Störig. Das Problem des Übersetzens. – Štutgartas, 1963 m.

48. Seleskovich D., Lederer M. Interpreter pour traduire. - Paryžius, 1987 m.

49. Snell-Hornby M. Vertimo studijos. Integruotas požiūris. – Amsterdamas, Filadelfija, 1988 m.

50. Sperber D., Wilson D. Aktualumas: bendravimas ir pažinimas. – Oksfordas, 1986 m.

51. Tirkkonen-Condit S. Tekstiniai vertimų kokybės vertinimo kriterijai, - Jyvaskyla, 1982 m.

52. Toury G. Vertimo teorijos beieškant. - TelAvivas, 1980 m.

53. Tytler A.F. Esė apie vertimo principus. - L., 1791 m.

54. Vehmas-Lehto I. Kvazikorektiškumas. – Helsinkis, 1989 m.

55. Vinay J.-P., Darbelnet J. Stilistique comparée du français et de 1"anglais. – Paryžius, 1968 m.

56. Voegelin C.F. Multiple Stage Translation // IJAL. - T.20, Nr.4, 1954 m.

57. Wilss W. Übersetzungswissenschaft: Probleme und Methoden. – Štutgartas, 1978 m.

58. Wilss W. Kognition und Übersetzen: Zu Theorie und Praxis der menschlichen und der maschinellen Übersetzung. - Tiusbingenas, 1988 m.

59. Shuttleworth M., Cowie M. Vertimo studijų žodynas. – Mančesteris, JK: St. Jerome Publishing, 1997. – 234 p.

Paydalangan sozdikter, resmi kuzhattar, okulyktar, audarylgan enbekter:

1. Ayapova Zh.M., Arynov E.M. Isker Adamny Oryssha-Kazachų ekonomika Tusіndіrme Sozdіgі. A., 1993 m

2. Egeubay A. Kisilik kitaby. – Almata, 1998 m.

3. Ibatovas A. Kutbtynas „Khusrau ua Shirin“ eilėraštis (XIV Gasyr - Almata, 1974).

4. Ibraeva A. Zan terminderinіn kazaksha-oryssha zhane oryssha-kazaksha kyskasha tussіndіrme sozdіgі. A., 1996 m

5. Kazachstano Respublikos sin konstitucija. A., 1995 m

6. Kazachstano Respublikos Sūnaus Konstitucija Sūnaus kūrinys. A., 1996 m

7. Kalijevas G. Tіlіmі terminderің tіndіrme сөздігі. A., 2005 m.

8. Kalijevas G., Bolganbajevas A. Kazirgі kazachų tіlіnіn leksikologijos ir frazeologijos. A., 2006 m

9. Kozhakhmetova Kh.K., T.B. kazachų-oryssha frazeologiškaiқ sozdіk. A., 1988 m

10. Rakhmatullin H. Bank termderin oryssha-kazaksha kyskasha sozdigi. A., 1992 m

11. Rustemovas L.Z. Arabų ir Irano kirme sozderin kazaksha-oryssha tusindirme sozdіgi. A., 1989 m

12. Rusų-kazachų patarlės ir priežodžiai / Comp. A. Turekhanovas ir kiti – A., 1999 m

13. Sapargalijevas G. Zaң terminderіnѣ tүsіndіrme сөздігі. A., 1995 m

14. Tazkire-i-Bugra Khan – kambarys Serikbay Kosan. – Almata: Tolagai, 2007 m.

Paydalangan derekkozder:

1. Abay. Shyғarmalarynyң eki tomdyk tolyk zhinagy. Ekinshi apimtis. Olender men audarmalar. Poemalar. Kara sozder. A., 1995 m

2. Altynsarinas Ybyray. Eki tomdyk shiғarmalar zhinagay. A., 1988 m

4. Auezovas M. Abajaus kelias / Vertė A. Kim. – A., 2007. 1 knyga.

5. Auezov M. Zhiyrma tomdyk shygarmalar zhinagay. A., t. XII, 1983, t. XІX, 1985 m.

6. Auezovas Muchtaras. Abai Zholy: Epas romanas. A., 1989 m.

7. Džambulas. Atrinkti darbai. A., 1981 m

8. Esenberlinas I. Almas kylysh (tarihi romanas). A., 1971 m

  • DE-1. Medžiagų struktūros ir savybių pagrindai. Fazinės transformacijos.
  • DE-2 Lydinių terminio apdorojimo ir paviršiaus grūdinimo pagrindai
  • 13 paskaita. Mašininis teksto vertimas. Kompiuterinių kalbų žodynai

    Pagrindai mašininis vertimas

    Vertimas yra kalbos tarpininkavimo rūšis, orientuota į užsienio kalbos originalą. Vertimas laikomas pranešimo, esančio originale, egzistavimo užsienio kalba forma. Tarpkalbinė komunikacija, vykdoma vertimo būdu, labiausiai atkartoja tiesioginio kalbinio bendravimo procesą, kai bendraujantys vartoja tą pačią kalbą.

    Mašininis vertimas yra automatinis žinių ir tekstų, parašytų natūralia kalba, gavimas naudojant kompiuterines programas remiantis kalbine parama.

    Mašininio vertimo procesas– Tai yra kompiuterio veiksmai paverčiant vienos natūralios kalbos tekstą į teksto ekvivalentą turiniu kita kalba, taip pat tokio veiksmo rezultatas.

    Automatinė teksto supratimo sistema, kyla iš to, kad tekstas natūralia kalba, sukurtas pagal žodynus, gramatiką ir natūralios kalbos algoritmus, paremtas semantiniu tinklu, rėmeliais ir tezaurais, yra suprantamas vartotojui dėl to, kad jis turi kalbinių žinių – sintaksinių. - semantines struktūras, taip pat specialias žinias.

    Dauguma automatinio kalbos apdorojimo sistemų siekia analizuoti tekstus, kurie buvo iš anksto suskirstyti į sakinius. Tačiau kalbos duomenys dažniausiai mums prieinami tekstų, suskirstytų į pastraipas, skyrius ir kitus didesnius vienetus, pavidalu. Todėl efektyviai automatinei jų analizei reikalingi atitinkami segmentavimo algoritmai.

    Užduotys kuriant automatinio teksto supratimo sistemą:

    · šaltinio prigimtinio teksto analizė, užtikrinanti kalbinių struktūrų, įskaitant įvairias semantines struktūras, konstravimą, pilną, dalinį, suspaustą, siekiant teksto turinį pateikti forma duomenų bazės,

    · teksto kalbinių struktūrų palyginimas su specialiomis ar individualiomis žiniomis, taip pat pateikiamas duomenų bazės pavidalu

    · tekstų apibendrinimas remiantis informacija, esančia tradicinėse reliacinėse duomenų bazėse, taip pat konceptualiose tekstų struktūrose ar atskirose duomenų bazėse.

    mašininio vertimo įgyvendinimasįėjo į kompiuterį speciali programa, įgyvendinant vertimo algoritmas, kuri suprantama kaip vienareikšmiškai ir griežtai apibrėžtų veiksmų su tekstu seka, siekiant rasti vertimo atitikmenis tam tikra kalbų pora tam tikrai vertimo krypčiai (iš vienos konkrečios kalbos į kitą). Taip pat yra atskirų mašininio vertimo sistemų, skirtų versti į tris ar daugiau kalbų, tačiau jos šiuo metu yra eksperimentinės.

    Šiuolaikinis mašininis arba automatinis vertimas atliekamas padedant asmeniui: išankstiniam redaktoriui, kuris vienaip ar kitaip iš anksto apdoroja verčiamą tekstą, tarpredaktoriui, kuris dalyvauja vertimo procese, ar posto. -redaktorius, kuris ištaiso mašinos išversto teksto klaidas ir praleidimus.

    Mašininio vertimo sistema apima dvikalbius žodynus, aprūpintus reikiama gramatine informacija (morfologine, sintaksine ir semantine), kurie užtikrina ekvivalentinių, variantinių ir transformacinių vertimo atitikmenų, aiškinamųjų ir specialiųjų perdavimą. dalykiniai žodynai, taip pat algoritminiai gramatinės analizės įrankiai, kurie įgyvendina bet kurią formalią gramatiką, priimtą automatiniam teksto apdorojimui.

    Labiausiai paplitęs yra toks formalių operacijų seka, analizės ir sintezės teikimas mašininio vertimo sistemoje:

    · teksto įvedimas ir įvesties žodžių formų paieška įvesties žodyne su lydinčia morfologine analize, kurios metu nustatomas tam tikros žodžio formos priklausymas konkrečiai leksemai. Analizės proceso metu informaciją, susijusią su kitais organizacijos lygiais, galima gauti ir iš žodžio formos. kalbos sistema.

    · tam tikros dalykinės srities idiomatinių frazių, frazeologinių vienetų ar klišių vertimas, pagrindinių įvesties teksto elementų gramatinių savybių nustatymas, homografijos raiška, leksinė analizė ir leksemų vertimas. Paprastai šiame etape vienareikšmiai žodžiai yra atskiriami nuo polisemantinių, po to vienareikšmiai žodžiai verčiami naudojant atitikmenų sąrašus, o daugiareikšmiams žodžiams versti naudojami vadinamieji kontekstiniai žodynai, kurių žodyno įrašai yra algoritmai konteksto užklausa dėl kontekstinės reikšmės kvalifikatorių buvimo / nebuvimo.

    · Galutinė gramatinė analizė, kurios metu, atsižvelgiant į tikslinės kalbos duomenis, nustatoma reikiama gramatinė informacija.

    · Išvesties žodžių formų ir sakinių visumos sintezė tikslinėje kalboje.

    Analizė ir sintezė gali būti atliekama tiek frazė po frazės, tiek visam tekstui, įrašytam į kompiuterio atmintį; pastaruoju atveju vertimo algoritmas numato vadinamųjų anaforinių ryšių identifikavimą.

    Mašininio vertimo kokybė priklauso nuo:

    · žodynų apimtis,

    · priskiriamos informacijos kiekis leksiniai vienetai,

    · kruopštumas rengiant ir tikrinant analizės ir sintezės algoritmų veikimą,

    · programinės įrangos efektyvumas.

    Tačiau dar negalima tikėtis, kad nė viena programa pateiks „teisingą“ literatūrinį teksto, sudaryto iš sudėtingų frazių, vertimą.

    Šiuolaikinė techninė ir programinė įranga leidžia naudoti didelius žodynus, kuriuose yra išsami gramatinė informacija. Informacija gali būti pateikta kaip deklaratyvus(aprašomasis) ir procedūrinis(atsižvelgiant į algoritmo poreikius) forma.

    Mašininio vertimo programų tobulinimas yra siejamas su minkštojo teksto supratimo samprata, pagal kurią skirtingi vartotojai iš to paties teksto išgauna informaciją ir savo individualią prasmę. Minkšto teksto supratimo modelis susideda iš gebėjimo generuoti skirtingas prasmingas pirminio objekto interpretacijas, priklausomai nuo skirtingų jo suvokimo sąlygų ir komponentų.

    Daugiau privačių „mašinų“ padėti vertėjui ir redaktoriui – tai automatiniai žodynai ir terminų duomenų bazės, kompiuteriniai tezaurai, ekrano redagavimo įrankiai, tekstų rašybos, terminų ir gramatikos taisymo sistemos.

    Šiuolaikinis mašininis vertimas turėtų būti atskirtas nuo kompiuterių naudojimo žmonėms vertėjams padėti. Pastaruoju atveju turime omenyje automatinis žodynas, kuri padeda žmogui greitai pasirinkti norimą vertimo atitikmenį. Nors abiem atvejais kompiuteris dirba kartu su asmeniu (vertėju ar redaktoriumi), sąvokos „mašininis vertimas“ turinys apima mintį, kad pagrindinę vertimo ir vertimo atitikmenų bei vertimo atitikmenų paieškos darbo dalį atlieka pats patys, palikdami asmeniui tik valdyti ir taisyti klaidas.

    Kompiuterinis žodynas padėti žmogui – tai pagalbinė priemonė norint greitai surasti vertimo atitikmenis; Tuo pačiu metu tokiuose žodynuose kai kurios automatinio vertimo sistemoms būdingos funkcijos gali būti įgyvendinamos ribotai.

    IN informacinės technologijos skirtis 2 pagrindiniai automatinio vertimo būdai:

    · paviršutiniškas susipažinimas su dokumento turiniu nepažįstama kalba

    · mašininio vertimo naudojimas vietoj įprasto „žmogiškojo“ vertimo. Tai apima kruopštų vertimo sistemos redagavimą ir pritaikymą konkrečiai temai.

    Žodyno išsamumas, dėmesys turiniui ir rinkiniui kalbinėmis priemonėmis išversti tekstai, leksinės dviprasmybės sprendimo metodų efektyvumas, gramatinės informacijos išgavimo, vertimo atitikmenų paieškos ir sintezės algoritmų efektyvumas.

    Kaip kalbos veiklos rūšis vertimas veikia visus kalbos lygius – nuo ​​grafemų (ir fonemų verčiant žodinę kalbą) atpažinimo iki teiginių ir teksto prasmės perteikimo. Be to, mašininis vertimas suteikia galimybę patikrinti teorines hipotezes apie tam tikrų kalbos lygių struktūrą ir siūlomų algoritmų efektyvumą.

    Reikia tobulėti mašininis vertimas nuolat didėja, nes tai yra svarbiausia sąlyga užtikrinant tarpkalbinį bendravimą, kurio apimtys kasmet didėja.

    Kiti bendravimo kalbos barjerų įveikimo būdai – tobulėjimas ar įvaikinimas viena kalba, kaip ir užsienio kalbų mokymasis, efektyvumo požiūriu negali lygintis su vertimu.

    Gimimo data mašininis vertimas kaip tyrimų sritis paprastai laikomas 1947 m. kovo mėn.; Būtent tada kriptografijos specialistas Warrenas Weaveris savo laiške Norbertui Wieneriui pirmą kartą iškėlė mašininio vertimo problemą, lygindamas ją su iššifravimo problema.

    Sprendžia mašininio vertimo problemas kompiuterinė lingvistika, kuris gimė 1954 m. sausį, kai Džordžtauno universitete (JAV) buvo atliktas pirmasis pasaulyje viešas mašininio vertimo eksperimentas. Tuo pačiu metu, vadovaujant iškiliam matematikui ir kibernetikui Aleksejui Lyapunovui, aktyvus darbas apie mašininį vertimą ir Maskvoje. 1956 m. pradžioje M.V. Taikomosios matematikos institute (IPM) pradėjo veikti pirmoji vietinė mašininio vertimo iš prancūzų kalbos į rusų kalbą sistema.

    Tarp šiuolaikinių mašininio vertimo programų Rusijoje lyderiai yra PROMT sistema (sukurta PROMT įmonės www.e-promt.ru) ir SOKRAT sistema (kurta bendrovės Arsenal, www.ars.ru).

    IN naujausia versija PROMT turi iš esmės naują funkciją „Associated Memory“. „Susijusios atminties“ mechanizmas leidžia treniruoti sistemą. Jos pagalba galite išsaugoti jus tenkinantį teksto vertimą žinių bazėje ir vėliau panaudoti jo fragmentus verčiant panašius tekstus.

    SOKRATAS bando rasti vienareikšmišką sprendimą ir nepateikia terminų variacijų: žodis, kurio nėra žodyne, išlieka originalia rašybą. PROMT paprastai siūlo keletą žodžių ir frazių vertimo variantų.

    Šiuo metu daugiausia dėmesio skiriama mašininiam vertimui, kuris išgyveno kelis kūrimo etapus idėja modeliuoti žmogaus vertėjo veiksmus. Vertimo procesas yra labai sunkus, o tinkamas programinės įrangos privalumų panaudojimas daugiausia lemia vertimo kokybę. Šiuolaikinės mašininio vertimo sistemos apima daugybę papildomi žodynai. Remiantis kalbinių algoritmų architektūrinių sprendimų ypatumais, sistemos skirstomos į du tipus - „Transfer“ ir „Interlingua“. Pagal šį skirsnį kuriamos automatinio vertimo programos. Taigi, pavyzdžiui, „Socrates“ programa verčia daug geriau nei, tarkime, „Magic Guddi“, nes pirmosios programos kalbinis palaikymas yra daug stipresnis, o žodynai yra daug didesni.

    Mašininio vertimo rezultatai visada turi būti redaguojami. Pavyzdžiui, programa Pars suteikia papildomo žodynų prijungimo funkciją įvairiomis temomis. Juk mašinos atliekamo vertimo kokybė priklauso ir nuo programinės įrangos kokybės. Tačiau net ir tiksliai derinant sistemą prie verčiamo teksto žodyno, neatsižvelgiama į visas jo ypatybes, todėl išversti žodžiai, turintys kelis sinonimus, yra pažymėti žvaigždute arba pateikiami skliausteliuose kaip parinktis.

    Interneto technologijos suteikė mašininio vertimo naujovių ir padėjo perkelti jį į naują plėtros etapą. Mašininis vertimas yra veiksminga priemonė informacijos peržiūrai ir paieškai užsienio kalba, ir tai yra pagrindinė funkcija dirbant internete. Dabartinė būsena mašininis vertimas leidžia gauti gana teisingus tinklalapių teksto vertimus iš daugelio kalbų. Nors visiškai automatinis aukštos kokybės vertimas neįmanomas, jau yra programinė įranga, kuris palengvina patį vertimo procesą.

    Dėl pritaikymo dalykinei sričiai ir integracijos su kitomis dokumentų apdorojimo programomis mašininis vertimas leidžia automatizuoti verčiamo teksto gamybą.

    Pagrindinė problema Visoms mašininio vertimo programoms reikia teisingai pasirinkti teminį žodyną, taip pat sukurti pagalbinius žodynus.

    Vertimas iš dalies priklauso nuo vartotojo pasirengimo lygio (kalbos žinios, darbo su programomis įgūdžiai, kalbos pojūtis), o taip pat labiau nuo jo gebėjimo teisingai dirbti su teksto redaktoriumi, pagalbinėmis programomis, žodynais ir frazeologiniai žinynai. Pateikiamos vertimų, atliktų naudojant teminius žodynus, parinktys geras vertimas, teisingas žodžio reikšmės pasirinkimas ir frazių vartojimas tekste. Tai paaiškinama tuo, kad mašina sukonfigūruoja savo žodyną, kad pasirinktų tuos sinonimus, kurie labiau atitiktų temą įeinanti kalba, ir verstų pagal tikslinės kalbos temą.

    2 požiūriai į mašininio vertimo kūrimo problemą:

    įrengimas naudojimui universali kalba prasmė, tiesioginis požiūris į vertimą, originalaus teksto pavertimas tiksliniu tekstu

    instaliacija tarpine kalba, modeliuojant žmogaus kalbos mokėjimą

    Problema ta, kad teksto reikšmė natūralia kalba priklauso ne tik nuo paties sakinio, bet ir nuo konteksto, kuris siejamas su žodžių ir sintaksinių struktūrų polisemija, praktiniu globalaus semantinės struktūros aprašymo neįmanomumu. net ir ribotoje dalykinėje srityje, o veiksmingų formalių metodų, apibūdinančių kalbinius modelius, stoka.

    Neišspręstos problemos mašininis vertimas yra

    · formaliojo dviprasmiškumo sprendimas analizuojant atskiri tekstiniai sakiniai

    · teksto skyrių (fragmentų) struktūrinio ir semantinio neužbaigtumo įveikimas

    · lankstaus skirtingų dalykinių sričių susiejimo organizavimas

    · būtinybė suprasti tekstą kaip visumą

    Mašininio vertimo programos geriau apdoroja mokslinius, techninius ir mokomuosius tekstus, kuriems būdingas griežtas medžiagos pateikimas.

    Mokomajam vertimui tinka šnekamoji ir publicistinis stilius, kur yra daug specifinių frazių, bet dauguma žodžių vartojami tiesiogine prasme, tačiau norint gauti kompetentingą išvesties tekstą, reikia redaguoti rankiniu būdu. Gautas vertimas yra savotiškas įvadinis tekstas, kuriame perteikiamas tik bendras teminis teksto akcentas.

    Vertimas grožinė literatūra o poezija neatitinka mašinos reikalavimų. Alegorinėmis išraiškomis pagrįsto teksto prasmė mašininio vertimo metu iškraipoma ir neprieinama net peržiūrai. Mašina nesupranta polisemijos, o tai savo ruožtu lemia neteisingą išversto teksto interpretaciją, kuri virsta nesąmone.

    Stebėdami galite pabandyti sumažinti tokius nesusipratimus laikantis taisyklių:

    · teisingai sudaryti teminius žodynus

    · patikrinti originalų tekstą prieš jo vertimo rengimo stadiją

    · redaguoti paskutiniame vertimo etape

    · teisingai naudoti žodyno programas

    · geras gramatikos ir žodyno bei temų išmanymas šaltinio tekstas

    · tinkamai veikti žodyną, klišės ir žodžių formos

    · laiku atnaujinti specialiuosius žodynus naujais terminais

    Kaip veikia vertėjo programa?

    Jis pagrįstas vertimo algoritmu - vienareikšmiškai ir griežtai apibrėžtų veiksmų su tekstu seka, siekiant rasti atitikmenis tam tikra kalbų pora L1 - L2 tam tikrai vertimo krypčiai (iš vienos konkrečios kalbos į kitą). Bendrieji žodynai ir gramatikos skirtingomis kalbomis netaikomi mašininiam vertimui, nes jie apibūdina žodžių reikšmes ir gramatinius raštus laisva forma, kuri jokiu būdu nėra priimtina „mašininiam“ naudojimui. Todėl reikalinga formali kalbos gramatika, t.y. logiškai nuoseklus ir aiškiai išreikštas (be jokių numanomų ar užuominų). Kai tik pradėjo atsirasti formalūs aprašymai įvairiose srityse kalba – pirmiausia morfologija ir sintaksė – buvo padaryta pažanga kuriant automatinio vertimo sistemas. Kad mašininio vertimo sistema veiktų sėkmingai, pirmiausia yra dvikalbiai žodynai, aprūpinti reikiama informacija (morfologine, susijusia su žodžių formomis, sintaksine, apibūdinančia žodžių jungimo būdus sakinyje ir semantinius, t.y. atsakingus už prasmę), antra. - gramatinės analizės priemonės, kurios remiasi viena iš formaliųjų, t.y. griežtas, gramatinis. Labiausiai paplitusi yra tokia formalių operacijų seka, kuri atlieka analizę ir sintezę mašininio vertimo sistemoje.

    • 1. Pirmajame etape įvedamas tekstas ir ieškoma įvesties žodžių formų (žodžiai tam tikros gramatinės formos, pvz. daugiskaita) įvedime su lydinčia morfologine analize, kurios metu nustatomas tam tikros žodžio formos priklausymas konkrečiai leksemai (žodžiui kaip žodyno vienetui). Analizės procese informaciją, susijusią su kitais kalbos sistemos organizavimo lygiais, galima gauti ir iš žodžio formos, pavyzdžiui, koks sakinio narys gali būti duotas žodis. Mašinai šių dviejų operacijų – gramatinės analizės ir žodžių reikšmės adresavimo – derinimas yra sudėtinga užduotis. Geriau sintaksinę analizę padaryti nepriklausomą nuo žodžių reikšmės, o kituose vertimo etapuose naudoti žodyną.
    • 2. Kas yra savarankiška sintaksinė analizė, galima suprasti, jei bandysite išanalizuoti frazę, iš kurios „pašalintos“ konkrečių žodžių reikšmės. Puikus tokio pobūdžio frazės pavyzdys yra akademiko L.V. Shcherboy pasiūlymas: Glokaya kuzdra shtetko budlanula bokr ir garbanos bokrenok. Beprasmė frazė? Tarsi taip: rusų kalboje nėra žodžių, iš kurių ji susideda (išskyrus jungtuką ir). Ir vis dėlto tam tikru mastu mes tai suprantame.
    • 3. Tai yra, mašina atlieka sakinio sintaksinę analizę, nesiremdama jį sudarančių žodžių reikšmėmis, naudodama tik informaciją apie jų gramatines savybes. Dėl sintaksinės analizės susidaro sintaksinė struktūra, kuri pavaizduota priklausomybės medžio forma: „šaknis“ yra predikatas, o „šakos“ – jos sintaksiniai ryšiai su priklausomi žodžiai. Kiekvienas sakinio žodis parašytas savo žodyno forma, o kartu ir tie gramatines savybes, kurį šis žodis turi analizuojamame sakinyje.
    • 4. 2. Kitas etapas apima tam tikros dalykinės srities idiomatinių frazių, frazeologinių vienetų ar klišių vertimą (pavyzdžiui, kai Anglų-rusų vertimas tokio tipo frazės, jei jos gauna vieną skaitmeninį atitikmenį ir neįtraukiamos į tolesnę gramatinę analizę); įvesties teksto elementų pagrindinių gramatinių (morfologinių, sintaksinių, semantinių ir leksinių) ypatybių (pavyzdžiui, daiktavardžių skaičiaus, veiksmažodžio laiko, jų vaidmens tam tikrame sakinyje ir kt.), sukurtų įvesties kalba, nustatymas. ; dviprasmybės sprendimas (pavyzdžiui, angliškas apvalus gali būti daiktavardis, būdvardis, prieveiksmis, veiksmažodis arba prielinksnis); žodžių analizė ir vertimas. Paprastai šiame etape vienareikšmiai žodžiai yra atskiriami nuo daugiareikšmių žodžių (turinčių daugiau nei vieną vertimo atitikmenį tikslinėje kalboje), po to vienareikšmiai žodžiai verčiami naudojant atitikmenų sąrašus, o daugiareikšminiams žodžiams išversti, t. naudojami kontekstiniai žodynai, kurių žodyno įrašai yra konteksto užklausos algoritmai esant/nesant kontekstinių reikšmės determinantų.
    • 5. 3. Galutinė gramatinė analizė, kurios metu, atsižvelgiant į tikslinės kalbos duomenis, nustatoma reikiama gramatinė informacija.
    • 6. 4. Išvesties žodžių formų ir sakinių visumos sintezė tikslinėje kalboje. Čia nebus įmanoma išsiversti tiesiog išverčiant medžio „mazgus“ į kitą kalbą. Kiekvienos kalbos sintaksė išdėstyta savaip: tai, kas rusiškame sakinyje yra subjektas, kitoje kalboje galima (ar reikia) išreikšti priedu, o priedas, priešingai, turi būti paverstas dalyku; tai, kas vienoje kalboje žymima žodžių grupe, į kitą verčiama tik vienu žodžiu ir pan. Šis perėjimas nuo struktūros prie tikrojo sakinio vadinamas sintaksine sinteze.
    • 7. Priklausomai nuo konkrečios kalbų poros morfologijos, sintaksės ir semantikos ypatybių bei vertimo krypties bendrasis algoritmas vertimas gali apimti kitus etapus, taip pat šių etapų ar jų atsiradimo tvarkos modifikacijas, tačiau tokio pobūdžio variantai modernios sistemos, kaip taisyklė, yra nereikšmingi. Žodžių dviprasmiškumo problemai spręsti naudojama konteksto analizė. Esmė ta, kad kiekviena iš kelių vertybių polisemantinis žodis daugeliu atvejų jie įgyvendinami savo kontekstų rinkinyje. Tai yra, kiekviena iš „konkuruojančių“ (interpretuojant) reikšmių turi savo kontekstų rinkinį. Ir būtent ši reikšmės priklausomybė nuo aplinkos leidžia klausytojui teisingai suprasti teiginį. Norint teisingai suprasti teiginį, taip pat būtina visiškai atsižvelgti į pasirinktos reikšmės sąlygojimo pagal leksinę aplinką taisykles (veikiant „frazeologiniu“ žodžio aiškinimu), pasirinktos reikšmės sąlygojimo taisykles. semantinis kontekstas (vadinamieji semantinio susitarimo dėsniai) ir pasirinktos reikšmės sąlygojimo gramatiniu (morfologiniu-sintaksiniu) kontekstu taisyklės.
    • 8. Dabartinės mašininio vertimo sistemos, kaip taisyklė, yra orientuotos į konkrečias kalbų poras (pavyzdžiui, prancūzų ir rusų arba japonų ir anglų) ir, kaip taisyklė, naudoja vertimo atitikmenis arba paviršiaus lygmeniu, arba tam tikru tarpiniu lygiu. lygis tarp įvesties ir išvesties kalbų. Mašininio vertimo kokybė priklauso nuo žodyno dydžio, leksiniams vienetams priskiriamos informacijos kiekio, analizės ir sintezės algoritmų veikimo kruopštumo ir patikrinimo bei programinės įrangos efektyvumo. Šiuolaikinė techninė ir programinė įranga leidžia naudoti didelius žodynus, kuriuose yra išsami gramatinė informacija. Informacija gali būti pateikiama tiek deklaratyvia (aprašomąja), tiek procedūrine (atsižvelgiant į algoritmo poreikius) forma.
    • 9. Vertimo praktikoje ir informacinėse technologijose yra du pagrindiniai požiūriai į mašininį vertimą. Viena vertus, mašininio vertimo rezultatai gali būti naudojami trumpam susipažinti su dokumento turiniu nežinoma kalba. Tokiu atveju jis gali būti naudojamas kaip signalo informacija ir nereikalauja kruopštaus redagavimo. Kitas metodas apima mašininio vertimo naudojimą vietoj įprasto žmogaus vertimo. Tai apima kruopštų vertimo sistemos redagavimą ir pritaikymą konkrečiai temai. Čia turi reikšmės žodyno išsamumas, dėmesys verčiamų tekstų turiniui ir kalbinių priemonių rinkiniui, leksinės dviprasmybės sprendimo metodų efektyvumas, gramatinės informacijos išgavimo, vertimo atitikmenų paieškos ir sintezės algoritmų algoritmų efektyvumas. Praktiškai tokio pobūdžio vertimas tampa ekonomiškai pelningas, jei verčiamų tekstų apimtis yra pakankamai didelė (bent kelios dešimtys tūkstančių puslapių per metus), jei tekstai yra pakankamai vienarūšiai, sisteminiai žodynai yra pilni ir leidžia toliau plėstis, programinę įrangą patogu redaguoti vėliau.

    Mašininis vertimas, tiksliau kompiuterinis vertimas, taip pat yra vertimas raštu, nes dėl to gauname rašytinį tekstą. Tačiau tai atlieka ne vertėjas, o speciali kompiuterinė programa. Šiuolaikinės kompiuterinio vertimo programos yra gana pažangios, tačiau jos vis tiek negali išspręsti labiausiai sunki užduotis vertimo procesas: kontekstui būtino varianto pasirinkimas, kurį kiekviename tekste lemia daugybė priežasčių. Šiuo metu tokio vertimo rezultatas gali būti naudojamas kaip būsimo teksto juodraštis, kurį redaguoja vertėjas, taip pat kaip priemonė bendram supratimui apie teksto temą ir turinį. ekstremalios situacijos, kai nėra vertėjo.

    Dar sunkesnė užduotis yra sakytinio teksto vertimas naudojant kompiuterines programas, nes sakytinės kalbos atpažinimo problema yra tik pradiniame jos sprendimo etape. Iki šiol neįveikiama kliūtis buvo individualus kalbos segmento garso nuspalvinimas – bet kuria kalba tokia kalba yra menkai formalizuota.

    Preliminarus sintaksės struktūros redagavimas gali apimti:

    · itin ilgo (daugiau nei 40 žodžių) sakinio skaidymas į kelis trumpesnius, pridedant (jei reikia) jungiamųjų elementų;

    · įvadas į Angliškas tekstas straipsniai, kai tai būtina arba gramatiškai pagrįsta;

    · elementų kartojimas derinant sakinio frazių ryšį;

    · jungtukų įvedimas, kai tarp sakinių naudojami nesusiję ryšiai;

    · konstrukcijų pašalinimas skliausteliuose daiktavardžio frazės viduryje arba sakinio viduryje;

    · retkarčiais vartojamų santrumpų pakeitimas pilnais vardais arba specialiųjų simbolių, neleidžiančių jų išversti, įvedimas;

    · panaikinti leksines ir logines elipses, neformalias konstrukcijas ir metaforas;

    · konstrukcijų ar sudėtingų žodžių, kurie gali būti tekste ištisiniu, brūkšneliu ir laisvai raštu, sudarymas į vieną formą.

    Tada rankiniu būdu redaguotas tekstas automatiškai apdorojamas MP sistemoje.

    25. Bendroji mašininio vertimo schema.

    Visame pasaulyje mašininio vertimo sistemų naudojimas, nepaisant visų jų silpnybių, jau seniai yra profesionalaus vertėjo darbo elementas, kuris turi mokėti kompiuteriu naudotis ne tik kaip rašomąja mašinėle. Automatizuoto vertėjo darbo vietos koncepcija, apimanti nuolatinių žodynų kompleksą, tezaurus, rašybos tikrinimo sistemas, informacijos prieigos įvairiais duomenų tinklais sistemas, filologui turėtų tapti įprasta.

    Kaip tokios automatizuotos vertėjo darbo vietos dalis gali būti naudojama tekstų mašininio vertimo (MT) sistema, užtikrinanti aukštos kokybės vertimą, kuris yra griežtai orientuotas į konkrečią dalykinę sritį, vartotojo užduotis ir dokumentacijos tipą. Be to, tokia sistema gali padėti nežinančiam vartotojui užsienio kalba, labai greitai ir už mažą kainą gauti apytikslį (apytikslį) dominančios srities tekstų vertimą, pakankamą suprasti tekstu perteikiamą informaciją užsienio kalba.

    Bendrieji reikalavimai praktinėms sistemoms

    mašininis vertimas (MT)

    · Sistemos stabilumas. MP sistema turi duoti rezultatą, kurį būtų galima naudoti net ir esant šaltinio medžiagos trūkumams ir nepilnam žodynui.

    · Sistemos replikacija. Sistema turėtų turėti gana paprastą programinę įrangą ir kalbinius įrankius, kad būtų galima išplėsti jos taikymo sritį.

    · Sistemos prisitaikymas. MP sistema turi turėti priemones pritaikyti ją konkrečių vartotojų poreikiams ir tvarkomų dokumentų ypatumams.

    · Optimalūs laiko parametrai. Teksto vertimo greitis turi atitikti arba per laiko vienetą gaunamos informacijos kiekį, arba vartotojo darbo standartus.

    · Vartotojo patogumas. Sistemos aptarnavimo įrenginiai turi užtikrinti vartotojo patogumą visais sistemoje galimais darbo režimais.

    Dirbdami su konkrečia mašininio vertimo sistema, turite atsiminti, kad vertimas atliekamas keliais žemesniais sistemos diegimo lygiais.

    Apskritai šie lygiai apima:

    · automatinio teksto išankstinio redagavimo lygis;

    · leksinės-morfologinės analizės lygis;

    · kontekstinės ir grupinės analizės lygis;

    · funkcinių segmentų analizės lygis;

    · pasiūlymo analizės lygis;

    · išvesties teksto sintezės lygis;

    · automatinio redagavimo lygis.

    Mašininio vertimo metodai

    Mašininio vertimo sistemos gali naudoti vertimo metodą, pagrįstą kalbinėmis taisyklėmis. Tinkamiausi šaltinio kalbos žodžiai tiesiog pakeičiami žodžiais iš tikslinės kalbos.

    Dažnai teigiama, kad už sėkmingas sprendimas mašininio vertimo problemas, būtina išspręsti teksto supratimo natūralia kalba problemą.

    Paprastai taisyklėmis pagrįstas vertimo metodas naudoja simbolinį atvaizdavimą (tarpininką), iš kurio kuriamas tekstas tiksline kalba. Ir jei atsižvelgsime į tarpininko pobūdį, galime kalbėti apie tarplingvistinį mašininį vertimą arba perdavimo mašininį vertimą. Šie metodai reikalauja labai didelių žodynų su morfologine, sintaksine ir semantine informacija bei dideliu taisyklių rinkiniu.

    Jei mašininio vertimo sistema turi pakankamai duomenų, galite gauti vertimą geros kokybės. Pagrindinis sunkumas yra generuojant šiuos duomenis. Pavyzdžiui, reikalingi dideli teksto korpusai statistiniais metodais vertimų, verčiant pagal gramatiką, pasirodo, kad jų nepakanka. Be to, pastariesiems reikalinga papildoma gramatinė užduotis.

    Norint išversti susijusias kalbas (rusų, ukrainiečių), gali pakakti paprasto žodžių pakeitimo.

    Šiuolaikinės mašininio vertimo sistemos skirstomos į tris dideles grupes:

    · pagrįsti taisyklėmis;

    remiantis pavyzdžiais;

    Taisyklėmis pagrįsta EMS

    Taisyklėmis pagrįstos mašininio vertimo sistemos yra bendras terminas, reiškiantis mašininio vertimo sistemas, pagrįstas kalbine informacija apie šaltinio ir tikslines kalbas.

    Juos sudaro dvikalbiai žodynai ir gramatikos, apimančios pagrindinius kiekvienos kalbos semantinius, morfologinius ir sintaksinius modelius. Toks požiūris į mašininį vertimą dar vadinamas klasikiniu.

    Remiantis šiais duomenimis, šaltinio tekstas nuosekliai, sakinys po sakinio, konvertuojamas į tikslinį tekstą. Dažnai tokios sistemos supriešinamos su mašininio vertimo sistemomis, kurios yra pagrįstos pavyzdžiais.

    Tokių sistemų veikimo principas yra ryšys tarp įvesties ir išvesties sakinių struktūros. Vertimas nėra itin kokybiškas. Bet toliau paprasti pavyzdžiai darbai.

    Vertimas iš anglų į vokiečių kalbą atrodytų taip:

    Mergina valgo obuolį. Ein Madchen yra einen Apfel.

    Šios sistemos skirstomos į tris grupes:

    · žodis po žodžio vertimo sistemos;

    · perdavimo sistemos;

    · tarpkalbinis;

    Žodis po žodžio vertimas

    Tokios sistemos dabar naudojamos itin retai dėl prastos vertimo kokybės. Pradinio teksto žodžiai paverčiami (tokie, kokie yra) į tikslinio teksto žodžius. Dažnai tokia transformacija įvyksta be lemmatizacijos ir morfologinės analizės. Tai paprasčiausias mašininio vertimo būdas. Jis naudojamas ilgiems žodžių sąrašams (pvz., katalogams) išversti. Jis taip pat gali būti naudojamas TM sistemų indeksui sudaryti.

    Perdavimo sistemos

    Kaip perdavimo sistemos, ir tarpkalbiniai, turi tą pačią bendrą idėją. Norint išversti, būtina turėti tarpininką, kuris perteiktų verčiamo posakio reikšmę. Tarpkalbinėse sistemose tarpininkas nepriklauso nuo kalbų poros, o perdavimo sistemose jis nepriklauso.

    Perkėlimo sistemos veikia labai paprastu principu: įvesties tekstui taikomos taisyklės, atitinkančios šaltinio ir tikslinės kalbos struktūras. Pradinis darbo etapas apima morfologinę, sintaksinę (o kartais ir semantinę) teksto analizę, siekiant sukurti vidinį vaizdą. Vertimas generuojamas iš šio pavaizdavimo naudojant dvikalbius žodynus ir gramatikos taisykles. Kartais, remiantis pirminiu vaizdu, kuris buvo gautas iš šaltinio teksto, sukuriamas „abstraktesnis“ vidinis vaizdas. Tai daroma siekiant pabrėžti vertimui svarbias vietas ir atmesti nesvarbias teksto dalis. Konstruojant vertimo tekstą vidinių reprezentacijų lygių transformacija vyksta atvirkštine tvarka.

    Naudojant šią strategiją, pasirodo gana aukštos kokybės vertimų, kurių tikslumas yra apie 90 % (nors tai labai priklauso nuo kalbų poros). Bet kurios perdavimo sistemos veikimas susideda iš mažiausiai penkių dalių:

    · morfologinė analizė;

    · leksinis perkėlimas;

    · struktūrinis perkėlimas;

    · morfologinė generacija.

    Morfologinė analizė. Žodžiai šaltinio tekste klasifikuojami pagal kalbos dalis. Jie atskleidžiami morfologinės savybės. Apibrėžiamos žodžių lemos.

    Leksinės kategorizacijos. Bet kuriame tekste kai kurie žodžiai gali turėti daugiau nei vieną reikšmę, todėl analizė gali būti neaiški. Leksinis skirstymas į kategorijas atskleidžia žodžio kontekstą. Galimi įvairūs užrašai ir paaiškinimai.

    Leksinis perkėlimas. Remiantis dvikalbiu žodynu, verčiamas žodis lemos. Veiksmas labai panašus į vertimą po žodžio.

    Struktūrinis perkėlimas. Žodžiai sutampa sakinyje.

    Morfologinė karta. Remiantis struktūrinio perdavimo išvesties duomenimis, sukuriamos verčiamo teksto žodinės formos.

    Viena iš pagrindinių transfoninių mašininio vertimo sistemų ypatybių yra žingsnis, kurio metu tarpinis teksto vaizdavimas šaltinio kalba yra „perkeliamas“ į tarpinį teksto atvaizdavimą tiksline kalba. Tai gali veikti viename iš dviejų kalbinės analizės lygių arba abiejuose.

    1. Paviršinis (sintaksinis) perkėlimas. Šiam lygiui būdingas „sintaksinių struktūrų“ perkėlimas tarp šaltinio ir tikslinės kalbos. Tinka tos pačios šeimos ar tipo kalboms, pavyzdžiui, romanų kalbomis, tarp italų ispanų, katalonų, prancūzų ir kt.

    2. Gilus (semantinis) perkėlimas. Lygiui būdingas semantinis vaizdavimas. Tai priklauso nuo originalo kalbos. Šį vaizdavimą gali sudaryti daugybė struktūrų, atspindinčių prasmę. Vertimas taip pat paprastai reikalauja struktūrinio perkėlimo. Šis lygis naudojamas verčiant iš tolimesnių kalbų.

    Tarpkalbinis mašininis vertimas

    Tarplingvistinis mašininis vertimas yra vienas iš klasikinių mašininio vertimo būdų. Originalus tekstas paverčiamas abstrakčia reprezentacija, kuri nepriklauso nuo kalbos (skirtingai nuo perkėlimo vertimo). Išverstas tekstas sukurtas remiantis šiuo vaizdu. Pagrindinis šio metodo privalumas yra tai, kad jis leidžia į sistemą įtraukti naują kalbą. Galima matematiškai įrodyti, kad taikant šį metodą, kiekvieno naujo kalbos vertėjo sukūrimas tokiai sistemai sumažins jos sąnaudas, palyginti, pavyzdžiui, su perkeliama vertimo sistema. Be to, taikant šį metodą tai įmanoma

    · įgyvendinti „teksto perpasakojimą“, perfrazuojant pradinį tekstą vienoje kalboje;

    · gana paprastas vertimas iš labai skirtingų kalbų, pavyzdžiui, rusų ir arabų.

    Tačiau vis dar nėra šio metodo, kuris tinkamai veiktų bent dviem kalbomis. Daugelis ekspertų išreiškia abejones dėl tokio įgyvendinimo galimybės. Didžiausias iššūkis kuriant tokias sistemas yra sukurti tarpkalbinį vaizdą. Ji turi būti ir abstrakti, ir nepriklausoma nuo konkrečių kalbų, tačiau kartu turi atspindėti bet kurios esamos kalbos bruožus. Kita vertus, dirbtinio intelekto rėmuose teksto prasmės identifikavimo uždavinys dar neišspręstas.

    Pirmą kartą tarplingvistinį požiūrį XVII amžiuje pasiūlė Dekartas ir Leibnicas, kurie pasiūlė universalius žodynus naudojant skaitmeninius kodus. Kiti, tokie kaip Cave Beck, Athanasius Kircher ir Johann Joachim Becher, siekė sukurti nedviprasmišką universalią kalbą, pagrįstą logikos ir ikonografijos principais.

    1668 m. Johnas Wilkinsas savo traktate „Esė apie tikrą simboliką ir filosofinę kalbą“ kalbėjo apie savo interlingvą.

    XVIII ir XIX amžiuje buvo sukurta daug universalių kalbų, įskaitant esperanto. Yra žinoma, kad universalios mašininio vertimo kalbos idėja niekaip nepasireiškė pradiniai etapaišios technologijos plėtra. Vietoj to buvo atsižvelgta tik į kalbų poras. Tačiau šeštajame ir šeštajame dešimtmečiuose mokslininkai Kembridže, vadovaujami Margaret Masterman, Leningrade Nikolajaus Andrejevo ir Milane Silvio Ceccato, pradėjo dirbti šioje srityje.

    Aštuntajame ir devintajame dešimtmečiuose šioje srityje buvo padaryta tam tikra pažanga ir buvo sukurta daugybė mašininio vertimo sistemų.

    Taikant šį vertimo metodą, interlingual vaizdavimas gali būti vertinamas kaip būdas aprašyti teksto analizę originalo kalba. Kartu reprezentacijoje išsaugomos morfologinės ir sintaksinės teksto savybės. Daroma prielaida, kad tokiu būdu „prasmė“ gali būti perteikta kuriant verčiamą tekstą.

    Šiuo atveju kartais naudojami du tarpkalbiniai atvaizdai. Vienas iš jų labiau atspindi šaltinio kalbos ypatybes. Kita kalba yra tikslinė kalba. Vertimas šiuo atveju atliekamas dviem etapais.

    Kai kuriais atvejais naudojami du ar daugiau to paties lygio atvaizdų (vienodai artimi abiem kalboms), tačiau skiriasi pagal temą. Tai būtina siekiant pagerinti konkrečių tekstų vertimo kokybę.

    Šis požiūris nėra naujas kalbotyroje. Jis pagrįstas kalbų artumo idėja. Siekiant pagerinti vertimo kokybę, natūrali kalba naudojama kaip tiltas tarp dviejų kitų kalbų. Pavyzdžiui, verčiant iš ukrainiečių į anglų kalbą kartais naudojama rusų kalba.

    Norėdami naudoti tarpkalbinę mašininio vertimo sistemą, jums reikia:

    · tekstų analizės ir generavimo žodynai;

    · kalbos gramatikų aprašymas;

    · sąvokų žinių bazė (sukurti tarpkalbinį vaizdą);

    · kalbų ir vaizdavimo sąvokų projekcijos taisyklės.

    Labiausiai sunkus momentas Kuriant šį tipą neįmanoma sukurti pagrindo plačioms žinių sritims. Ir tos duomenų bazės, kurios yra sukurtos labai konkrečioms temoms, turi didelį skaičiavimo sudėtingumą.