Машины орчуулгын алдааны үндсэн төрлүүд. шинжлэх ухааны салбар болгон

58. Рецкер Я.И. Орчуулахдаа байнгын захидал харилцаанд төрөлх хэл// Боловсролын орчуулгын онол, арга. - М., 1950. С.

59. Рецкер Я.И. Орчуулгын онол, орчуулгын практик. - М., 1974

60. Семенова М.Ю. Текст орчуулгын үндэс. - М., 2009

61. Стрелковский Г.М. Цэргийн орчуулгын онол практик. - М., 1979

62. Тер-Минасова S. G. Хэл ба соёл хоорондын харилцаа. - М.. 2000 он

63. Тюленев С.В. Орчуулгын онол. - М.: Гардарики, 2004

64. Федоров А.В. Орчуулгын ерөнхий онолын үндэс. - SPB., 2002

65. Флорин С., Влахов С. Орчуулгад орчуулагдах боломжгүй. - М., 1980

66. Халеева И.И. Гадаад ярианы ойлголтыг заах онолын үндэс (орчуулагч бэлтгэх). - М., 1989

67. Чомский Н. Хэл ба сэтгэлгээ. - М., 1972

68. Чернов Г.В. Синхрон орчуулгын онол практик. - М., 1978

69. Чужакин А., Палажченко П. Орчуулгын ертөнц буюу харилцан ойлголцлын мөнхийн эрэл. М., 1997 - 2004 он

70. Чуковский К.И. Өндөр урлаг. - М., 1968.

71. Schweitzer A.D. Орчуулгын онол (байдал, асуудал, талууд). М., 1998

72. Schweitzer A. D. Орчуулга ба хэл шинжлэл. - М., 1973.

73. Ширяев А.Ф. Орчуулга нь шинжлэх ухааны цогц судалгааны объект болох // Орчуулгын хэл шинжлэлийн асуудал. - М., 1981.

74. Ширяев А.Ф. Синхрон орчуулга хийх гарын авлага. - М., 1982.

75. Ширяев А.Ф. Орчуулгын онол. Статус. Асуудал, талууд. М., 1988

76. Шадрин V.I. Онол удахгүйорчин үеийн орчуулга судлалд // Багш, аспирантуудын их дээд сургууль хоорондын XXVIIІ эрдэм шинжилгээ, арга зүйн бага хурлын эмхэтгэл. Асуудал. 5. Орчуулгын онол практикийн тулгамдсан асуудлууд. 1999 оны 3-р сарын 15-22 Санкт-Петербург, 1999 он.

Алыс шэтелдэ шыккан адэбиэттэр:

1. Басснетт-МакГайр С. Орчуулгын судлал. - Метуен, Л. ба Н.-Ю., 1980.

2. Brislin R.W.(ed). орчуулга. Хэрэглээ ба судалгаа. - Н.-Ю., 1976.

3. Brower R. (ed). Орчуулга дээр. - Кембриж (Масс.), 1959.

5. Кэтфорд Ж. Орчуулгын хэл шинжлэлийн онол. - Л., 1965 он.

6. Coseriu E. Teoria del lenguaje in lingliistica general. Cinco estudias. - Мадрид, 1973 он.

7. Dolet E. De la manie're de bien traduire d'une langue en l'autre. - П., 1540

8. Delisle J. L'analyse du discourse comme methode de traduction. - Оттава, 1984 он

9. Драйден Ж.Овидын захидлууд // В.П.Кер (ред.) Жон Драйдений эссе.- Оксфорд, 1926.

10. Firth J.R. Хэл шинжлэлийн шинжилгээ ба орчуулга // Роман Якобсоны хувьд. - Гааг, 1956 он.

11. Гёте Ж.В. Drei Stucke vom Übersetzen // H.J. Storig (Hrsg.). Дас асуудал des Obersetzen. - Штутгарт, 1963 он.

12. Гутт Э.-А. Орчуулга ба хамаарал. Танин мэдэхүй ба нөхцөл байдал. - Кембридж (Масс.), 1991.

13. Guttinger F. Zielsprache. Онол ба техник des Ubersetzens. - Цюрих, 1963 он.

14. Halliday M.A.K. Харьцуулалт ба орчуулга // M.A.K. Halliday, A. McIntosh, P. Strevens. Хэл шинжлэлийн шинжлэх ухаан ба хэл заах. - Л., 1964 он.

15. Halliday M.A.K. Хэлний харьцуулалт // A.Mclntosh, M.A.K.

16. Холлидэй. Хэлний хэв маяг. Л., 1966.

17. Holz-Mänttäri J. Transtatorisches Handeln. онол, арга. - Хельсинки, 1964 он.

18. Хумбольдт, В.Эйнлейтунг зу "Агамемнон" // Х.Ж. Сториг (Hrsg.). Дас асуудал des Obersetzens. - Штутгарт, 1963 он.

19. Jäger G. Translation und Translationslinguistik. - Халле (Саале), 1975 он.

20. Jäger G., Müller D. Communikative und maximale Äquivalenz von Texten

// Äquivalenz bei der Translation. - Лейпциг, 1982.

21. Jäger G. Die sprachlichen Bedeutungen - das zentrale Problem bei der Translation und ihrer wissenschaftlichen Beschreibung // Bedeuting und Translation. Лейпциг, 1986 он.

22. Якобсон Р. Орчуулгын хэл шинжлэлийн асуудлын тухай // Р.Броуэр (ред.). Орчуулга дээр. - Кембриж (Масс.), 1959.

23. Kade O. Zufall und Gezetzmassigkeit in der Übersetzung. - Лейпциг, 1968 он.

24. Kade O. Die Sprachmittling als gesellschaftliche Erscheinung und Gegenstand wissenschaftlicher Untersuchung. - Лейпциг, 1980 он.

25. Келлетат А.Ф. Rackschritte der Obersetzungstheorie-г үхээрэй. - Вааса, 1986.

26. Koller W. Einfürung in die Übersetzungswissenschaft // 6. Auflage. Wiebelsheim, 2001

27. Крингс Х.П. Дэн Копфен фон Үберсетцерн воргехт байсан. - Тюбинген, 1986.

28. Lederer, M. La traduction simultanee. Туршлага ба онол. - Парис, 1981 он.

29. Luther M. Sendbrief vom Dolmetschen // H.J. Störig (Hrsg.). Дас асуудал des Obersetzens. - Штутгарт, 1963 он.

30. Lyudskanov A. Prevezhdat chovekt болон машин. - София, 1957 он.

31. Mounin C. Les problem theoriques de la traduction. - Парис, 1963 он.

32. Mounin G. Teoria et storia, della traduzione. - Турин, 1965 он.

33 Mounin G. Linguistique et traduction. - Брюссель, 1976.

34. Neubert A. Pragmatische Aspekte der Übersetzung // A. Neubert (Hrsg.).

Grundfragen der Übersetzungswissenschaft. - Лейпциг, 1968 он.

35 Нойберт А. Текст ба орчуулга. - Лейпциг, 1985 он.

37. Нида Е. Библийн орчуулгын жишээ болгон орчуулах зарчмууд. // Р.Бропер (ред.) Орчуулгын тухай. - Кембриж (Масс.), 1959.

38. Nida E. Орчуулгын шинжлэх ухаан руу. - Лейден, 1964 он

39. Нида Э., Табер К.Р. Орчуулгын онол практик. - Лейден, 1964 он.

40. Nida E, Reyburn W.D. Соёл хоорондын утга. - Н-Ю., 1976.

41 Quine W. Утга ба орчуулга. // Р.Броуэр (ред.) Орчуулгын тухай. - Кембриж (Масс.), 1959.

42. Reiss K. Möglichkeiten und Grenzen der Übersetzungskritik. - Мюнхен, 1971.

43. Reiss K.. Vermeer H.J. Grundlegung einer allgermeinen Translationstheorie. Тубинген, 1984.

44 Rose M.D. (ред.). Орчуулгын спектр. Онол практикийн эссе. - Олбани, 1981 он.

45 Росс С.Д. Орчуулга ба ижил төстэй байдал // M.D. Rose (ed.) Translation Spectrum. - Олбани, 1981 он.

46. ​​Savory T. Орчуулгын урлаг. - Л., 1952.

47. Schleiermacher F. Methoden des Übersetzens // H.J. Störig. Дас асуудал des Obersetzens. - Штутгарт, 1963 он.

48. Seleskovich D., Lederer M. Interpreter pour traduire. - Парис., 1987.

49. Снелл-Хорнби М. Орчуулга судлал. Нэгдсэн арга. - Амстердам, Филадельфи, 1988 он.

50. Спербер Д., Вилсон Д. Хамаарал: Харилцаа холбоо ба танин мэдэхүй. - Оксфорд, 1986.

51. Тиркконен-Кондит С. Орчуулгын чанарын үнэлгээний текстийн шалгуур, - Jyvaskyla, 1982.

52. Тури Г. Орчуулгын онолыг хайж байна. - ТельАвив, 1980.

53. Тайлер А.Ф. Орчуулгын зарчмуудын тухай эссэ. - Л., 1791.

54. Vehmas-Lehto I. Бараг зөв байдал. - Хельсинки, 1989.

55. Vinay J.-P., Darbelnet J. Stilistique comparée du français et de 1 "anglais. - Парис, 1968.

56. Voegelin C.F. Олон үе шаттай орчуулга // IJAL. - 20-р боть, №4, 1954.

57. Wilss W. Übersetzungswissenschaft: Probleme und Methoden. - Штутгарт, 1978.

58. Wilss W. Kognition und Übersetzen: Zu Theorie und Praxis der menschlichen und der maschinellen Übersetzung. - Түсбинген, 1988.

59. Shuttleworth M., Cowie M. Орчуулга судлалын толь бичиг. - Манчестер, Их Британи: Гэгээн Жером хэвлэлийн газар, 1997. - 234 х.

Paidalangan sozdikter, resmi kuzhattar, okulyktar, audarylgan enbekter:

1. Аяпова Ж.М., Арынов Е.М. Искэр адамнын орысша-казакша экономикалык тусиндирмэ создиги. А., 1993 он

2. Эгеубай А. Кисилик китабы. - Алматы, 1998 он.

3. Ибатов А.Кутбтын “Хусрау уа Ширийн” шүлгийн үг (XIV касыр) .- Алматы, 1974.

4. Ибраева А.Зан терминдэрин казакша-орысша жане орысша-казакша кыскаша тусиндирмэ создиги. А., 1996 он

5. Казахстан Республикасын үндсэн хуулиуд. А., 1995 он

6. Казахстан Республикасын Үндсэн хуулийнын тусиндирме создиги. А., 1996 он

7. Калиев Г. Tіl bіlіmi terminderіnіn tіsіndіrme sozdіgі. А., 2005.

8. Калиев Г., Болганбаев А. Казирги казак хэлний лексикологи, хэлц зүй. А., 2006

9. Кожахметова Х.К., т.б. Казахша-орысша фразеологилык создик. А., 1988

10. Рахматуллин Х. А., 1992

11. Рустемов Л.З. Араб-Иран кирмэ создэринин казакша-орысша тусиндирмэ создиги. А., 1989

12. Орос-Казах зүйр цэцэн үгс / Comp. А.Туреханов болон бусад - А., 1999

13. Сапаргалиев Г. Заң терминдэрин тїсїндiрме сєздєгi. А., 1995 он

14. Тазкире-и-Бүгра хан - Өрөө Серикбай Косан. - Алматы: Толагай, 2007.

Paydalangan derekkozder:

1. Абай. Шыгармаларын эки томдык толык жинагы. Экинши боть. Olender men audarmalar. Шүлэг. Кара бүтээсэн. А., 1995 он

2. Алтансарин Ыбырай. Хоёр томдык шыгармалар жинагы. А., 1988

4. Ауэзов М.Абайн зам / Орчуулсан А.Ким. - А., 2007. 1-р дэвтэр.

5. Ауэзов М.Жийрма томдык шыгармалар жинагы. А., XII боть, 1983, XIX боть, 1985.

6. Ауэзов Мухтар. Абай Жолы: Туульс. А., 1989 он.

7. Жамбул. Сонгосон бүтээлүүд. А., 1981

8. Есөнбэрлин I. Алмас кылыш (тарихи роман). А., 1971

  • DE-1. Материалын бүтэц, шинж чанарын үндэс. Фазын өөрчлөлтүүд.
  • ДЭ-2.Хайлшийг дулааны боловсруулалт ба гадаргуугийн хатуурлын үндэс
  • Лекц 13. Текстийн машин орчуулга. Компьютерийн хэлний толь бичиг

    Машин орчуулгын үндэс

    Орчуулга- Энэ бол гадаад хэлний эх хэл дээр төвлөрсөн хэлний зуучлалын нэг төрөл юм. Орчуулга нь эх хувь дахь мессежийн оршин тогтнох гадаад хэлний хэлбэр гэж тооцогддог. Орчуулгаар дамждаг хэл хоорондын харилцаа холбоо нь ижил хэлээр ярьдаг шууд аман харилцааны үйл явцыг хамгийн их хэмжээгээр бүтээдэг.

    Машинаар орчуулахашиглан байгалийн хэлээр бичигдсэн мэдлэг, текстийг автоматаар гаргаж авах явдал юм компьютерийн програмуудхэл шинжлэлийн дэмжлэг дээр үндэслэсэн.

    Машин орчуулгын үйл явцгэдэг нь нэг байгалийн хэл дээрх текстийг өөр хэл дээрх агуулгатай дүйцэхүйц текст болгон хөрвүүлэх компьютерийн үйлдэл, түүнчлэн ийм үйлдлийн үр дүн юм.

    Автомат текст ойлгох систем, байгалийн хэлний толь бичиг, дүрэм, алгоритмын дагуу семантик сүлжээ, фрейм, тезаурид тулгуурлан бүтээсэн байгалийн хэл дээрх бичвэр нь хэл шинжлэлийн мэдлэгтэй тул хэрэглэгчдэд ойлгомжтой байдагтай холбоотой юм. - синтакс-семантик бүтэц, түүнчлэн тусгай мэдлэг.

    Хэлний автомат боловсруулалтын ихэнх системүүд нь өгүүлбэрт урьдчилан хуваагдсан бичвэрүүдэд дүн шинжилгээ хийх зорилготой. Гэсэн хэдий ч хэлний өгөгдөл нь догол мөр, бүлэг болон бусад том нэгж болгон тэмдэглэсэн текст хэлбэрээр бидэнд ихэвчлэн байдаг. Тиймээс тэдгээрийг үр дүнтэй автоматаар шинжлэхийн тулд зохих сегментчлэлийн алгоритмууд хэрэгтэй.

    Текст ойлгох автомат системийг бий болгох даалгаварууд:

    Төрөл бүрийн семантик бүтэц, бүрэн, хэсэгчилсэн, шахсан, текстийн агуулгыг хэлбэрээр харуулах хандлагатай, хэл шинжлэлийн бүтцийг бий болгох боломжийг олгодог анхны байгалийн текстийн шинжилгээ мэдээллийн сан,

    Текстийн хэл шинжлэлийн бүтцийг тусгай эсвэл бие даасан мэдлэгтэй харьцуулах, мөн мэдээллийн сан хэлбэрээр танилцуулах

    · Уламжлалт харилцааны мэдээллийн сан, түүнчлэн концепцийн текстийн бүтэц эсвэл бие даасан мэдээллийн санд агуулагдах мэдээлэлд үндэслэн текстийг ерөнхийд нь гаргах.

    Учир нь машин орчуулгакомпьютерт орсон тусгай хөтөлбөр, ухамсарлах орчуулгын алгоритм,Энэ нь орчуулгын тодорхой чиглэлд (нэг хэлнээс нөгөө хэл рүү) өгөгдсөн хос хэл дээрх орчуулгын захидал харилцааг олохын тулд текстэн дээр хоёрдмол утгагүй, хатуу тодорхойлсон үйлдлийн дараалал гэж ойлгогддог. Гурав ба түүнээс дээш хэлээр орчуулах зориулалттай бие даасан машин орчуулгын системүүд байдаг ч одоогоор туршилтын шатандаа явж байна.

    Орчин үеийн машин эсвэл автомат орчуулгыг хүний ​​тусламжтайгаар гүйцэтгэдэг: орчуулах текстийг ямар нэг байдлаар урьдчилан боловсруулдаг урьдчилан редактор, орчуулгын үйл явцад оролцдог хоорондын редактор, эсвэл дараах редактор. машинаар орчуулсан бичвэрийн алдаа дутагдлыг хэн засч .

    Машины орчуулгын системд шаардлагатай дүрмийн мэдээллээр (морфологи, синтаксик ба семантик) хангагдсан хоёр хэл дээрх толь бичгүүд багтдаг бөгөөд тэдгээр нь эквивалент, хувилбар, хувиргах орчуулгын захидал, тайлбар, тусгай орчуулгыг дамжуулах боломжийг олгодог. сэдэвчилсэн толь бичиг, түүнчлэн текстийг автоматаар боловсруулахад зориулагдсан аливаа албан ёсны дүрмийг хэрэгжүүлдэг дүрмийн шинжилгээний алгоритмын хэрэгслүүд.

    Хамгийн түгээмэл нь дараахь зүйл юм албан ёсны үйл ажиллагааны дараалал,Машин орчуулгын системд дүн шинжилгээ, синтез хийх:

    текст оруулах, өгөгдсөн үгийн хэлбэр нь тодорхой лексемд хамаарах байдлыг тогтоодог морфологийн шинжилгээ бүхий оролтын толь бичгээс оруулах үгийн хэлбэрийг хайх. Шинжилгээний явцад байгууллагын бусад түвшинд хамаарах мэдээллийг үгийн хэлбэрээс ч авч болно. хэлний систем.

    · Тухайн сэдвийн хүрээний хэлц хэллэг, хэлц үгийн нэгж эсвэл тамганы орчуулга, оролтын текстийн элементүүдийн дүрмийн үндсэн шинж чанарыг тодорхойлох, омографийн шийдэл, үг зүйн шинжилгээ, лексемүүдийн орчуулга. Ихэвчлэн энэ үе шатанд нэг утгатай үгсийг полисмантик үгсээс салгаж, дараа нь нэг утгатай үгсийг эквивалентуудын жагсаалтын дагуу орчуулж, олон утгатай үгсийг орчуулахад контекстологийн толь бичгүүдийг ашигладаг. контекст үнэ цэнийг тодорхойлох хүчин зүйлс байгаа эсэх / байхгүй байгаа эсэхийг контекстээс асуух алгоритмууд.

    · Гаралтын хэлний өгөгдлийг харгалзан шаардлагатай дүрмийн мэдээллийг дахин тодорхойлсон эцсийн дүрмийн дүн шинжилгээ.

    · Зорилтот хэл дээрх гаралтын үгийн хэлбэр, өгүүлбэрийг ерөнхийд нь нэгтгэх.

    Шинжилгээ, синтезийг хэллэгээр болон компьютерийн санах ойд оруулсан бүх текстийн аль алинд нь хийж болно; Сүүлчийн тохиолдолд орчуулгын алгоритм нь анафорик холбоос гэж нэрлэгддэг тодорхойлолтыг өгдөг.

    Машин орчуулгын чанархамаарна:

    Толь бичгийн хэмжээ

    Холбогдох мэдээллийн хэмжээ лексик зүйлүүд,

    дүн шинжилгээ, синтезийн алгоритмын ажлыг эмхэтгэх, турших нарийвчлал;

    програм хангамжийн үр ашиг.

    Гэсэн хэдий ч хөтөлбөрүүдийн аль нь ч нарийн төвөгтэй хэллэгүүдээс бүрдсэн текстийн "зөв", уран зохиолын орчуулгыг хүлээж чадахгүй.

    Орчин үеийн техник хангамж, программ хангамж нь дүрмийн нарийвчилсан мэдээлэл агуулсан том толь бичгүүдийг ашиглах боломжийг олгодог. Мэдээллийг танилцуулж болно тунхаглал(тайлбарлах) ба процедурын(алгоритмын хэрэгцээг харгалзан) хэлбэр.

    Машин орчуулгын программыг сайжруулахЗөөлөн текстийг ойлгох ойлголттой холбоотой бөгөөд үүний дагуу өөр өөр хэрэглэгчид ижил текстээс өөрсдийн мэдээлэл, хувийн утгыг гаргаж авдаг. Зөөлөн текстийг ойлгох загварЭнэ нь түүний ойлголтын янз бүрийн нөхцөл, бүрэлдэхүүн хэсгүүдээс хамааран анхны объектын янз бүрийн утга учиртай тайлбарыг бий болгох чадвараас бүрддэг.

    Илүү хувийн "машин хэрэгсэл"Орчуулагч, редакторт туслах - эдгээр нь автомат толь бичиг, нэр томъёоны мэдээллийн сан, компьютерийн тезаури, дэлгэцийн засварлах хэрэгсэл, текстийн зөв бичих, нэр томъёо, дүрмийн засварлах систем юм.

    Орчин үеийн машин орчуулгыг хүний ​​орчуулагчдад туслах компьютер ашиглахаас ялгах хэрэгтэй. Сүүлчийн тохиолдолд энэ нь гэсэн үг юм автомат толь бичиг, энэ нь тухайн хүнд хүссэн орчуулгын эквивалентыг хурдан сонгоход тусалдаг. Хэдийгээр энэ хоёр тохиолдолд компьютер нь хүнтэй (орчуулагч эсвэл редактор) хамт ажилладаг боловч "машины орчуулга" гэсэн нэр томъёоны агуулга нь орчуулга хийх, орчуулах дүйцэхүйц, орчуулгын захидал харилцааг олох үндсэн, ихэнх ажлыг машин авдаг гэсэн санааг агуулдаг. өөрсдөө, тухайн хүнд зөвхөн хяналт тавьж, алдаа засах л үлддэг.

    компьютерийн толь бичигхүнд туслах - энэ бол орчуулсан тохирохыг хурдан олох туслах хэрэгсэл юм; Үүний зэрэгцээ, ийм толь бичгүүдэд машин орчуулгын системд хамаарах зарим функцийг хязгаарлагдмал хэмжээгээр хэрэгжүүлэх боломжтой.

    IN мэдээллийн технологиялгаатай Машин орчуулга хийх 2 үндсэн арга:

    үл мэдэгдэх хэл дээрх баримт бичгийн агуулгатай өнгөц танилцах

    Ердийн "хүний" орчуулгын оронд машин орчуулгыг ашиглах. Энэ нь тухайн сэдвийн хүрээнд орчуулгын системийг сайтар засварлах, өөрчлөх явдал юм.

    Толь бичгийн бүрэн бүтэн байдал, орчуулсан текстийн хэлний хэрэгслийн агуулга, багцад анхаарлаа төвлөрүүлэх, үгийн олон утга санааг арилгах аргын үр нөлөө, дүрмийн мэдээллийг задлах алгоритмын үр нөлөө, орчуулгын захидал харилцааг олох, нэгтгэх алгоритмууд үүнд чухал үүрэг гүйцэтгэдэг.

    Хэлний үйл ажиллагааны нэг төрөлОрчуулга нь хэлний бүх түвшинд нөлөөлдөг - графемыг танихаас (амаар ярианы орчуулга дахь фонемууд) үг хэллэг, текстийн утгыг шилжүүлэх хүртэл. Нэмж дурдахад, машины орчуулга нь хэлний тодорхой түвшний бүтэц, санал болгож буй алгоритмуудын үр дүнтэй байдлын талаархи онолын таамаглалыг шалгах боломжийг олгодог.

    Сайжруулах шаардлагатайМашин орчуулга нь хэл хоорондын харилцааг хангах хамгийн чухал нөхцөл учраас жил бүр нэмэгдсээр байна.

    Харилцааны хэлний бэрхшээлийг даван туулах бусад арга замууд - хөгжүүлэх эсвэл үрчлэн авах нийтлэг хэл, түүнчлэн гадаад хэл судлах - үр ашгийн хувьд орчуулгатай харьцуулах боломжгүй.

    төрсөн өдөрсудалгааны чиглэлийн хувьд машин орчуулгыг ихэвчлэн 1947 оны 3-р сар гэж үздэг; тэр үед л криптографч Уоррен Уивер Норберт Винерт бичсэн захидалдаа машин орчуулгын асуудлыг шифр тайлахтай харьцуулан анх тавьжээ.

    машин орчуулгын асуудлуудыг шийддэг тооцооллын хэл шинжлэл, энэ нь 1954 оны 1-р сард Жоржтауны их сургуульд (АНУ) машин орчуулга хийх дэлхийн анхны олон нийтийн туршилт явагдах үед төрсөн. Үүний зэрэгцээ хамгийн том математикч, кибернетикч Алексей Ляпуновын удирдлаган дор идэвхтэй ажилмашин орчуулга болон Москвад. 1956 оны эхээр М.В.Келдышийн нэрэмжит Хэрэглээний Математикийн Хүрээлэнд (IPM) франц хэлнээс орос хэл рүү машин орчуулах анхны дотоодын систем ажиллаж эхэлсэн.

    Орос дахь орчин үеийн машин орчуулгын программуудын дунд тэргүүлэгч нь PROMT систем (PROMT, www.e-promt.ru боловсруулсан) болон SOCRAT систем (Арсенал, www.ars.ru боловсруулсан) юм.

    IN Хамгийн сүүлийн үеийн хувилбар PROMT нь цоо шинэ "Холбогдох санах ой" функцтэй. "Холбоотой санах ой" механизм нь системийг сургах боломжийг олгодог. Үүний тусламжтайгаар та өөрт тохирсон текстийн орчуулгыг мэдлэгийн санд хадгалж, дараа нь ижил төстэй текстийг орчуулахдаа түүний хэлтэрхийг ашиглах боломжтой.

    СОКРАТ хоёрдмол утгагүй шийдлийг олохыг хичээдэг бөгөөд нэр томьёоны зөрүүг өгдөггүй: толь бичигт байхгүй үг анхны зөв бичгийн дүрмээр үлддэг. PROMT нь ихэвчлэн үг, хэллэгийг орчуулах хэд хэдэн сонголтыг санал болгодог.

    Хөгжлийнхөө хэд хэдэн үе шатыг туулсан машин орчуулга одоогоор гол анхаарлаа хандуулж байна хүний ​​орчуулагчийн үйлдлийг загварчлах санаа. Орчуулах үйл явц нь маш хэцүү бөгөөд програм хангамжийн давуу талыг зөв ашиглах нь орчуулгын чанарыг ихээхэн тодорхойлдог. Орчин үеийн машин орчуулгын системүүд нь олон нэмэлт толь бичгүүдийг агуулдаг. Хэл шинжлэлийн алгоритмуудын архитектурын шийдлүүдийн онцлогт үндэслэн системийг "Шилжүүлэх" ба "Интерлингва" гэсэн хоёр төрөлд хуваадаг. Автомат орчуулгын программуудыг энэ хэсгийн дагуу бүтээдэг. Жишээлбэл, "Сократ" хөтөлбөр нь "Ид шид"-ээс хамаагүй дээр орчуулагддаг, учир нь эхний хөтөлбөрийн хэл шинжлэлийн дэмжлэг илүү хүчтэй, толь бичгүүд нь илүү том хэмжээтэй байдаг.

    Машины орчуулгын үр дүнг үргэлж засварлаж байх ёстой. Жишээлбэл, "Парс" програм нь янз бүрийн сэдвүүдийн толь бичгүүдийн нэмэлт холболтын функцийг хангадаг. Эцсийн эцэст, машины орчуулгын чанар нь програм хангамжийн чанараас хамаарна. Гэхдээ орчуулсан текстийн үгсийн санд системийг нарийн тааруулах нь түүний бүх онцлогийг харгалзан үздэггүй тул хэд хэдэн ижил утгатай орчуулагдсан үгсийг одоор тэмдэглэсэн эсвэл хаалтанд оруулдаг.

    Интернет технологимашин орчуулгад шинэ хөгжлийг өгч, түүнийг хөгжлийн шинэ шатанд гаргахад тусалсан. Машин орчуулга үр дүнтэй эмчилгээгадаад хэлээр мэдээлэл үзэх, хайх, тухайлбал энэ функц нь Интернет дээр ажиллахад гол үүрэг гүйцэтгэдэг. Одоогийн байдалМашины орчуулга нь ихэнх хэлнээс вэб хуудасны текст орчуулгыг харьцангуй зөв авах боломжийг олгодог. Бүрэн автоматаар өндөр чанартай орчуулга хийх боломжгүй ч аль хэдийн байдаг програм хангамжЭнэ нь орчуулгын үйл явцыг өөрөө хөнгөвчилдөг.

    Сэдвийн талбарт тохируулж, бусад баримт бичиг боловсруулах програмуудтай нэгтгэсний үр дүнд машин орчуулга нь орчуулсан текстийг хүлээн авах автоматжуулалт хийх боломжийг олгодог.

    Гол асуудалБүх машин орчуулгын програмуудын нэг нь сэдэвчилсэн толь бичгийг зөв сонгох, түүнчлэн туслах толь бичгүүдийг бий болгох явдал юм.

    Орчуулга нь хэрэглэгчийн мэдлэгийн түвшингээс (хэлний мэдлэг, программтай ажиллах ур чадвар, хэлний мэдрэмж), түүнчлэн текст засварлагч, туслах хэрэгслүүдтэй зөв ажиллах чадвараас ихээхэн хамаардаг. толь бичиг ба фразеологийн лавлагаа. Сэдэвчилсэн толь бичгүүдийн холболтоор хийсэн орчуулгын хувилбаруудыг өгдөг сайн орчуулга, үгийн утгыг зөв сонгох, текст дэх хэллэгийг ашиглах. Энэ нь тухайн машин нь тухайн сэдэвтэй илүү хамааралтай ижил утгатай үгсийг сонгохын тулд толь бичгээ тохируулдагтай холбоотой юм. ирж буй хэл, мөн тухайн хэлний сэдэвтэй уялдуулан орчуулах болно.

    Машин орчуулгыг хөгжүүлэх асуудалд 2 хандлага:

    Ашиглах суурилуулалт бүх нийтийн хэлутга, орчуулгад шууд хандах, эх бичвэрийг орчуулсан текст болгон хувиргах

    хүний ​​хэлний мэдлэгийг загварчлах, дундын хэл рүү тохируулах

    Асуудал нь байгалийн хэлний текстийн утга нь зөвхөн өгүүлбэрээс хамаардаггүй, мөн контекстээс хамаардаг бөгөөд энэ нь үгийн хоёрдмол утгатай, синтаксик бүтэцтэй холбоотой, үгийн утгын бүтцийг дэлхийн хэмжээнд тайлбарлах практик боломжгүй юм. хязгаарлагдмал сэдвийн хүрээнд ч гэсэн ертөнц, мөн үр дүнтэй албан ёсны арга байхгүй. хэл шинжлэлийн хэв маягийн тодорхойлолт.

    Шийдэгдээгүй асуудлуудмашин орчуулга юм

    албан ёсны тодорхой бус байдлыг шийдвэрлэх задлан шинжлэхтусгаарлагдсан текст өгүүлбэрүүд

    текстийн хэсгүүдийн (хэсэг) бүтцийн болон семантик бүрэн бус байдлыг даван туулах

    янз бүрийн сэдвүүдийн уян хатан холболтыг зохион байгуулах

    текстийг бүхэлд нь боловсрол гэж ойлгох хэрэгцээ

    Машины орчуулгын программууд нь шинжлэх ухаан, техникийн болон боловсролын текстийг боловсруулахад илүү сайн байдаг бөгөөд энэ нь материалын хатуу танилцуулгатай байдаг.

    Хэлэлцүүлэг, сэтгүүлзүйн хэв маяг нь олон тооны тодорхой эргэлттэй боловч ихэнх үгсийг шууд утгаар нь ашигладаг бөгөөд оршил орчуулга хийхэд тохиромжтой боловч чадварлаг гаралтын текстийг олж авахын тулд гараар засварлах шаардлагатай байдаг. Үүссэн орчуулга нь зөвхөн текстийн ерөнхий сэдэвчилсэн чиг хандлагыг дамжуулдаг нэг төрлийн танилцуулга текст юм.

    Орчуулга уран зохиолмөн яруу найраг нь машины шаардлагад нийцдэггүй. Зохиомол үг хэллэг дээр үндэслэсэн текстийн утга нь машин орчуулгын явцад гажууддаг бөгөөд үүнийг хянах боломжгүй байдаг. Машин нь хоёрдмол утгатай байдлыг ойлгодоггүй бөгөөд энэ нь орчуулсан текстийг буруу тайлбарлахад хүргэдэг бөгөөд энэ нь утгагүй зүйл болж хувирдаг.

    Та ажигласнаар иймэрхүү үл ойлголцлыг багасгахыг оролдож болно дагаж мөрдөх дүрэм:

    Сэдэвчилсэн толь бичгийг зөв зохиох

    эх бичвэрийг орчуулах бэлтгэлийн үе шатанд шалгах

    орчуулгын эцсийн шатанд засварлах

    толь бичгийн программыг зөв ашиглах

    дүрэм, үгсийн сан, сэдвийн талаар сайн мэдлэгтэй эх код

    зөв ажиллагаа үгсийн сан, cliches болон үгийн хэлбэрүүд

    тусгай толь бичгүүдийг шинэ нэр томъёогоор цаг тухайд нь нөхөх

    Орчуулагчийн програм хэрхэн ажилладаг вэ?

    Энэ нь орчуулгын алгоритм дээр суурилдаг - орчуулгын өгөгдсөн чиглэлд (нэг хэлнээс нөгөө хэл рүү) өгөгдсөн L1 - L2 хэл дээрх тохирохыг олох текст дээрх өвөрмөц бөгөөд хатуу тодорхойлсон үйлдлийн дараалал юм. Тогтмол толь бичиг, дүрэм өөр өөр хэлЭдгээр нь үгийн утга, дүрмийн хэв маягийг хатуу бус хэлбэрээр дүрсэлсэн тул "машин" ашиглахад ямар ч тохиолдолд хүлээн зөвшөөрөгдөхгүй тул машин орчуулгад хамаарахгүй. Тиймээс хэлний албан ёсны дүрэм хэрэгтэй, i.e. логикийн хувьд нийцтэй, тодорхой илэрхийлсэн (ямар ч далд болон орхигдуулалгүйгээр). Хэлний янз бүрийн чиглэлүүдийн албан ёсны тайлбарууд гарч ирэнгүүт, ялангуяа морфологи, синтакс - автомат орчуулгын системийг хөгжүүлэхэд ахиц дэвшил гарсан. Амжилттай ажиллахын тулд машин орчуулгын системд нэгдүгээрт, шаардлагатай мэдээллээр хангагдсан хоёр хэл дээрх толь бичгүүд (морфологи, үгийн хэлбэр, синтакс, өгүүлбэрт үгсийг хэрхэн нэгтгэж болохыг тайлбарлах, утгыг хариуцах) багтана. хоёрдугаарт, албан ёсны аль нэгэнд үндэслэсэн дүрмийн шинжилгээний арга хэрэгсэл, өөрөөр хэлбэл хатуу, дүрэм. Хамгийн түгээмэл нь машин орчуулгын систем дэх дүн шинжилгээ, синтезийг хангадаг албан ёсны үйлдлүүдийн дараах дараалал юм.

    • 1. Эхний шатанд текстийг оруулж, оролтын үгийн хэлбэрийг хайдаг (тодорхой дүрмийн хэлбэрт байгаа үгс, жишээлбэл, үсэг олон тоо) өгөгдсөн үгийн хэлбэр нь тодорхой лексемд (толь бичгийн нэгж болох үг) хамаарах байдлыг тогтоодог морфологийн шинжилгээ бүхий оролтонд. Шинжилгээний явцад хэлний тогтолцооны зохион байгуулалтын бусад түвшинтэй холбоотой мэдээллийг үгийн хэлбэрээс, жишээлбэл, өгүүлбэрийн аль гишүүн байж болохыг олж авч болно. үг өгсөн. Машины хувьд эдгээр хоёр үйлдлийг хослуулах - дүрмийн шинжилгээ, үгийн утгыг татах нь хэцүү ажил юм. Үгсийн утгаас хамааралгүй синтаксийн шинжилгээ хийж, орчуулгын бусад үе шатанд толь бичгийг ашиглах нь зүйтэй.
    • 2. Бие даасан синтаксик шинжилгээ гэж юу вэ, та тодорхой үгсийн утгыг "хасах" хэллэгийг задлан шинжилж үзвэл ойлгох болно. Энэ төрлийн хэллэгийн гайхалтай жишээг академич Л.В. Хачирхалтай санал: Гялалзсан куздра бокрагаа дээш нь бөхийлгөж, бокраг буржгарлав. Утгагүй хэллэг үү? Тийм юм шиг: Орос хэл дээр үүнээс бүрдсэн үг байдаггүй (эвлэл ба холбооноос бусад). Гэсэн хэдий ч тодорхой хэмжээгээр бид үүнийг ойлгож байна.
    • 3. Өөрөөр хэлбэл, машин нь өгүүлбэрийг бүрдүүлэгч үгсийн утгад тулгуурлахгүйгээр зөвхөн дүрмийн шинж чанарын талаархи мэдээллийг ашиглан өгүүлбэрийн синтаксик шинжилгээ хийдэг. Синтаксийн шинжилгээний үр дүнд хамаарлын мод хэлбэрээр дүрслэгдсэн синтаксийн бүтэц үүсдэг: "үндэс" нь предикат, "салбарууд" нь түүний хамааралтай үгстэй синтаксийн харилцаа юм. Өгүүлбэрийн үг бүрийг толь бичгийн хэлбэрээр, түүнтэй хамт бичдэг дүрмийн шинж чанарууд, энэ үг задлан шинжилж буй өгүүлбэрт байгаа.
    • 4. 2. Дараагийн үе шатанд энэ сэдэвт хамаарах хэлц үг хэллэг, хэлц үг хэллэг эсвэл маркийн орчуулга орно (жишээлбэл, хэзээ Англи-Орос орчуулгатохиолдолд гэх мэт хэллэгүүд нь нэг тоон эквивалентыг хүлээн авах бөгөөд цаашдын дүрмийн шинжилгээнээс хасагдсан болно); Оролтын хэлэнд бий болсон оролтын текстийн элементүүдийн үндсэн дүрмийн (морфологи, синтаксик, семантик ба лексик) шинж чанарыг (жишээлбэл, нэр үгийн тоо, үйл үгийн цаг, энэ өгүүлбэрт гүйцэтгэх үүрэг гэх мэт) тодорхойлох; ойлгомжгүй байдлыг арилгах (англи хэл нь нэр үг, нэр үг, үйл үг, угтвар үг байж болно гэж хэлье); үгийн шинжилгээ, орчуулга. Ихэвчлэн энэ үе шатанд нэг утгатай үгсийг полисмантик үгсээс (зорилтот хэл дээр нэгээс илүү орчуулгатай) салгаж, дараа нь нэг утгатай үгсийг эквивалентуудын жагсаалтын дагуу орчуулж, контекст судлалын толь бичгүүдийг ашигладаг. Толь бичгийн оруулгууд нь контекст утгыг тодорхойлох хүчин зүйл байгаа/байгаа үед контекстийг асуух алгоритмууд болох полисмантик үгсийг орчуулах.
    • 5. 3. Гаралтын хэлний өгөгдлийг харгалзан шаардлагатай дүрмийн мэдээллийг тодорхойлох эцсийн дүрмийн дүн шинжилгээ.
    • 6. 4. Зорилтот хэл дээрх гаралтын үгийн хэлбэр, өгүүлбэрийг ерөнхийд нь нэгтгэх. Энд модны "зангилаа" -ыг өөр хэл рүү энгийн орчуулга хийх боломжгүй болно. Хэл бүрийн синтаксийг өөрийн гэсэн байдлаар зохион байгуулдаг: орос хэл дээрх субьект нь өөр хэл дээрх объектоор илэрхийлэгдэх боломжтой (эсвэл байх ёстой) бөгөөд объект нь эсрэгээрээ субьект болж хувирах ёстой; нэг хэлэнд бүлэг үгээр тэмдэглэсэн зүйлийг зөвхөн нэг үгээр нөгөө хэл рүү орчуулах гэх мэт. Бүтцээс бодит өгүүлбэрт шилжих энэхүү шилжилтийг синтаксийн нийлэгжилт гэнэ.
    • 7. Тодорхой хос хэлний морфологи, синтакс, утга зүйн онцлог, орчуулгын чиглэлээс хамааран ерөнхий алгоритмОрчуулга нь бусад алхмууд, түүнчлэн эдгээр алхмууд эсвэл тэдгээрийн дарааллын өөрчлөлтийг багтааж болох боловч орчин үеийн системд ийм төрлийн өөрчлөлтүүд нь дүрмээр бол ач холбогдолгүй байдаг. Үгийн хоёрдмол байдлын асуудлыг шийдэхийн тулд контекст шинжилгээг ашигладаг. Баримт нь полисемантик үгийн хэд хэдэн утга тус бүр нь ихэнх тохиолдолд өөрийн гэсэн контекстэд хэрэгждэг. Өөрөөр хэлбэл, "өрсөлдөгч" (тайлбар дор) утга тус бүр өөрийн гэсэн контексттэй байдаг. Чухамхүү орчноос утгын хамаарал нь сонсогчдод уг мэдэгдлийг зөв ойлгох боломжийг олгодог. Мэдэгдэлийг зөв ойлгохын тулд лексик орчноос сонгосон утгын нөхцөл байдлын дүрмийг (үгний "фразеологийн" тайлбарт ажилладаг), үгийн нөхцөл байдлын дүрмийг бүрэн анхаарч үзэх шаардлагатай. семантик контекстээр сонгосон утга (семантик тохиролцооны хууль гэж нэрлэгддэг) ба сонгосон утгын дүрмийн (морфологи-синтакс) нөхцөл байдлын дүрмүүд.
    • 8. Одоо байгаа машин орчуулгын системүүд нь тодорхой хэлний хосуудад (жишээлбэл, франц, орос эсвэл япон, англи хэл) чиглэх хандлагатай байдаг ба орчуулгын тохирлыг өнгөц түвшинд эсвэл оролт ба гаралтын хэлнүүдийн дунд завсрын түвшинд ашиглах хандлагатай байдаг. Машины орчуулгын чанар нь толь бичгийн хэмжээ, лексик нэгжид хамаарах мэдээллийн хэмжээ, анализ, синтезийн алгоритмын ажиллагааг сайтар эмхэтгэх, шалгах, програм хангамжийн үр нөлөө зэргээс хамаарна. Орчин үеийн техник хангамж, программ хангамж нь дүрмийн нарийвчилсан мэдээлэл агуулсан том толь бичгүүдийг ашиглах боломжийг олгодог. Мэдээллийг тунхаг (тайлбарлах) болон процедурын (алгоритмын хэрэгцээг харгалзан) хэлбэрээр танилцуулж болно.
    • 9. Орчуулгын практикт болон мэдээллийн технологид машин орчуулгын хоёр үндсэн хандлага байдаг. Нэг талаас, машин орчуулгын үр дүнг үл мэдэгдэх хэл дээрх баримт бичгийн агуулгатай өнгөцхөн танилцахад ашиглаж болно. Энэ тохиолдолд үүнийг дохионы мэдээлэл болгон ашиглаж болох бөгөөд болгоомжтой засварлах шаардлагагүй болно. Өөр нэг арга бол ердийн "хүний" оронд машин орчуулгыг ашиглах явдал юм. Энэ нь тухайн сэдвийн хүрээнд орчуулгын системийг сайтар засварлах, өөрчлөх явдал юм. Толь бичгийн бүрэн бүтэн байдал, орчуулсан текстийн хэлний хэрэгслийн агуулга, багцад анхаарлаа төвлөрүүлэх, үгийн олон утга санааг арилгах аргын үр нөлөө, дүрмийн мэдээллийг задлах алгоритмын үр нөлөө, орчуулгын захидал харилцааг олох, нэгтгэх алгоритмууд үүнд чухал үүрэг гүйцэтгэдэг. Практикт энэ төрлийн орчуулга нь орчуулсан текстийн хэмжээ хангалттай том (жилд дор хаяж хэдэн арван мянган хуудас), хэрэв текстүүд хангалттай нэгэн төрлийн байвал системийн толь бичгүүд бүрэн дүүрэн, цаашид өргөжүүлэх боломжийг олгодог бол эдийн засгийн хувьд ашигтай болно. мөн программ хангамж нь засварын дараа хийхэд тохиромжтой.

    Машины, эс тэгвээс компьютерийн орчуулга бас байдаг бичгийн орчуулга, учир нь үр дүнд нь бид бичсэн текстийг авдаг. Гэхдээ үүнийг орчуулагч биш, харин тусгай компьютерийн программ хийдэг. Орчин үеийн компьютерийн орчуулгын програмууд нь нэлээд дэвшилтэт боловч орчуулгын үйл явцын хамгийн хэцүү ажлыг шийдэж чадахгүй байна: текст бүрд олон шалтгааны улмаас контекст шаардлагатай сонголтыг сонгох. Одоогийн байдлаар энэ төрлийн орчуулгын үр дүнг орчуулагчийн засварлах ирээдүйн текстийн ноорог хувилбар болгон ашиглахаас гадна текстийн сэдэв, агуулгын талаар ерөнхий ойлголттой болох хэрэгсэл болгон ашиглаж болно. орчуулагч байхгүй онцгой нөхцөл байдалд.

    Амаар яриа таних асуудал нь зөвхөн шийдвэрлэх эхний шатанд байгаа тул компьютерийн програм ашиглан аман текстийг орчуулах нь илүү хэцүү ажил юм. Өнөөг хүртэл даван туулах боломжгүй саад бэрхшээл бол ярианы сегментийн дууг тус тусад нь будах явдал юм - ямар ч хэл дээр ийм яриа нь албан ёсны чанар муутай байдаг.

    Синтаксийн бүтцийг урьдчилан засварлах нь:

    · хэт урт өгүүлбэрийг (40 гаруй үг) хэд хэдэн богино өгүүлбэр болгон хувааж, (шаардлагатай бол) холбох элементүүдийг нэмэх;

    · танилцуулга Англи хэл дээрх текстшаардлагатай эсвэл дүрмийн үндэслэлтэй өгүүлэл;

    · өгүүлбэр дэх хэллэгүүдийн уялдаа холбоотой элементүүдийг давтах;

    · өгүүлбэрүүдийн хоорондох холбоот холболтыг ашиглах үед эвлэлийг нэвтрүүлэх;

    · нэр үгийн дунд эсвэл өгүүлбэрийн дунд байрлах хаалтанд байгаа бүтцийг арилгах;

    · хааяа товчлолыг бүтэн нэрээр солих эсвэл орчуулахыг зөвшөөрдөггүй тусгай тэмдэгтүүдийг оруулах;

    · лексик ба логик эллипс, албан бус бүтэц, зүйрлэлийг арилгах;

    · Текстээс үргэлжилсэн, тасархай, чөлөөт үсгийн хэлбэрээр олддог бүтэц, нийлмэл үгсийг нэг хэлбэрт оруулах.

    Гараар засварласан текст дараа нь MP системд автоматаар боловсруулагдана.

    25. Машин орчуулгын ерөнхий схем.

    Дэлхий даяар машин орчуулгын системийг ашиглах нь бүх сул талыг үл харгалзан орчуулагчийн мэргэжлийн ажлын нэг хэсэг байсаар ирсэн бөгөөд тэрээр зөвхөн бичгийн машин төдийгүй компьютер ашиглах чадвартай байх ёстой. Оршин суугч толь бичиг, тезаури, зөв ​​бичгийн дүрмийн алдаа шалгах систем, мэдээлэл дамжуулах янз бүрийн сүлжээгээр дамжуулан мэдээлэлд нэвтрэх системийг багтаасан орчуулагчийн ажлын станц гэсэн ойлголт нь мэргэжлийн филологчийн хувьд нийтлэг байх ёстой.

    Машины орчуулгын (MT) системийг ийм орчуулагчийн ажлын хэсэг болгон ашиглаж болохын зэрэгцээ тодорхой сэдэв, хэрэглэгчийн даалгавар, баримт бичгийн төрөлд онцгой анхаарал хандуулсан өндөр чанартай орчуулгыг хангах боломжтой. Нэмж дурдахад ийм систем нь гадаад хэл мэддэггүй хэрэглэгчдэд өөрийн сонирхсон мэдлэгийн чиглэлээр текстийн ойролцоо (барзгар) орчуулгыг олж авахад нь маш хурдан бөгөөд бага зардлаар туслах болно. гадаад хэл дээрх бичвэрээр дамжуулсан.

    Практик системд тавигдах ерөнхий шаардлага

    машин орчуулга (MT)

    · Системийн тогтвортой байдал. МТ систем нь эх сурвалжийн согог, бүрэн бус үгсийн сантай байсан ч ашиглах боломжтой үр дүнг өгөх ёстой.

    · Системийн хуулбарлах чадвар. Систем нь хэрэглээний цар хүрээг тэлэхийн тулд нэлээд энгийн програм хангамж, хэл шинжлэлийн хэрэгслүүдтэй байх ёстой.

    · Системийн дасан зохицох чадвар. MP систем нь тодорхой хэрэглэгчдийн хэрэгцээ, боловсруулсан баримт бичгийн онцлогт тохируулан өөрчлөх хэрэгсэлтэй байх ёстой.

    · Цагийн оновчтой байдал. Текстийг орчуулах хурд нь цаг хугацааны нэгжид хүлээн авсан мэдээллийн хэмжээ, эсвэл хэрэглэгчдийн ажлын нормтой тохирч байх ёстой.

    · Хэрэглэгчийн тав тухтай байдал. Системийн үйлчилгээний хэрэгслүүд нь системийн бүх боломжит горимд хэрэглэгчийн тав тухыг хангах ёстой.

    Тодорхой машин орчуулгын системтэй ажиллахдаа орчуулга нь системийн хэрэгжилтийн хэд хэдэн дэд түвшинд явагддаг гэдгийг санах хэрэгтэй.

    Эдгээр түвшин нь ерөнхийдөө:

    · текстийг автоматаар урьдчилан засварлах түвшин;

    · лексик ба морфологийн шинжилгээний түвшин;

    · контекст дүн шинжилгээ, бүлгийн дүн шинжилгээ хийх түвшин;

    · функциональ сегментүүдийн шинжилгээний түвшин;

    · саналын дүн шинжилгээний түвшин;

    · гаралтын текстийн синтезийн түвшин;

    · засварын дараах автомат түвшин.

    Машин орчуулгад хандах хандлага

    Машин орчуулгын систем нь хэлний дүрэмд суурилсан орчуулгын аргыг ашиглаж болно. Эх хэлнээс хамгийн тохиромжтой үгсийг зорилтот хэлний үгээр солино.

    Машин орчуулгын асуудлыг амжилттай шийдвэрлэхийн тулд текстийг байгалийн хэлээр ойлгох асуудлыг шийдвэрлэх шаардлагатай гэж байнга маргаж байдаг.

    Дүрэмд суурилсан орчуулгын арга нь дүрмээр бол бэлгэдлийн дүрслэлийг (зуучлагч) ашигладаг бөгөөд үүний үндсэн дээр зорилтот хэл дээрх текстийг бүтээдэг. Хэрэв бид зуучлагчийн мөн чанарыг харгалзан үзвэл хэл хоорондын машин орчуулга эсвэл шилжүүлэх машин орчуулгын талаар ярьж болно. Эдгээр аргууд нь морфологи, синтакс, семантик мэдээлэл бүхий маш том толь бичиг, олон тооны дүрэм журам шаарддаг.

    Хэрэв машин орчуулгын систем хангалттай өгөгдөлтэй бол сайн чанарын орчуулгыг авах боломжтой. Гол бэрхшээл нь эдгээр өгөгдлийг бүрдүүлэхэд оршдог. Жишээлбэл, том хэмжээний текст шаардлагатай статистикийн аргуудДүрэмд суурилсан орчуулгын орчуулга хангалтгүй байна. Түүнээс гадна, сүүлийнх нь дүрмийн нэмэлт даалгавар шаардлагатай.

    Холбогдох хэлийг (Орос, Украин) орчуулахын тулд үгсийг энгийн орлуулахад хангалттай.

    Орчин үеийн машин орчуулгын системийг гурван том бүлэгт хуваадаг.

    дүрэмд суурилсан

    жишээн дээр үндэслэсэн

    SMP дүрэмд суурилсан

    Дүрэмд суурилсан машин орчуулгын систем нь эх болон зорилтот хэлний талаарх хэл шинжлэлийн мэдээлэлд суурилсан машин орчуулгын системийг хэлдэг ерөнхий нэр томъёо юм.

    Эдгээр нь хэл бүрийн семантик, морфологи, синтаксийн үндсэн хэв маягийг хамарсан хоёр хэлний толь бичиг, дүрмээс бүрддэг. Машин орчуулгын энэ аргыг сонгодог гэж нэрлэдэг.

    Эдгээр өгөгдөл дээр үндэслэн эх бичвэрийг өгүүлбэрээр дараалан орчуулсан текст болгон хөрвүүлдэг. Ихэнхдээ ийм системүүд нь жишээн дээр үндэслэсэн машин орчуулгын системээс ялгаатай байдаг.

    Ийм системийн үйл ажиллагааны зарчим нь оролтын болон гаралтын өгүүлбэрийн бүтцийн хоорондын холбоо юм. Орчуулга нь тийм ч сайн чанартай биш юм. Гэхдээ энэ нь энгийн жишээн дээр ажилладаг.

    Англи хэлнээс герман руу орчуулах нь дараах байдлаар харагдах болно.

    Нэг охин алим идэж байна. Ein Madchen isst einen Apfel.

    Эдгээр системийг гурван бүлэгт хуваадаг.

    Үгээр орчуулах систем;

    · дамжуулах систем;

    хэл хоорондын;

    Үг орчуулга

    Орчуулгын чанар муу учраас ийм системийг одоо маш ховор ашигладаг. Эх бичвэрийн үгсийг орчуулсан текстийн үг рүү (байгаагаар нь) хөрвүүлдэг. Ихэнхдээ ийм өөрчлөлт нь лемматизаци, морфологийн шинжилгээгүйгээр тохиолддог. Энэ бол машин орчуулгын хамгийн энгийн арга юм. Энэ нь үгсийн урт жагсаалтыг (жишээ нь лавлах) орчуулахад хэрэглэгддэг. Үүнийг мөн TM-системд зориулсан шугаман холболт үүсгэхэд ашиглаж болно.

    Дамжуулах систем

    Дамжуулах систем шиг, болон хэл хоорондын шинжлэх ухаан нь ижил ерөнхий санаатай. Орчуулахын тулд орчуулсан хэллэгийн утгыг агуулсан зуучлагч байх шаардлагатай. Хэл хоорондын системд зуучлагч нь хос хэлээс хамаардаггүй бол дамжуулалтын системд хамаардаг.

    Дамжуулах системүүд нь маш энгийн зарчмаар ажилладаг: эх болон зорилтот хэлний бүтцэд тохирсон оролтын текстэд дүрмийг баримтална. Ажлын эхний үе шатанд дотоод дүрслэлийг бий болгохын тулд текстийн морфологи, синтаксик (заримдаа семантик) шинжилгээ орно. Орчуулга нь хоёр хэлний толь бичиг, дүрмийн дүрмийг ашиглан энэхүү дүрслэлээс бүтээгдсэн. Заримдаа эх бичвэрээс олж авсан үндсэн дүрслэлд үндэслэн илүү "хийсвэр" дотоод дүрслэлийг бүтээдэг. Энэ нь орчуулгад чухал ач холбогдолтой газруудыг онцлон тэмдэглэж, текстийн чухал бус хэсгийг хаяхын тулд хийгддэг. Орчуулгын текстийг бүтээхдээ дотоод дүрслэлийн түвшний өөрчлөлт нь урвуу дарааллаар явагддаг.

    Энэ стратегийг ашиглах үед энэ нь хангалттай юм өндөр чанартайорчуулга, 90% -ийн нарийвчлалтай (хэдийгээр энэ нь хэлний хосоос ихээхэн хамаардаг). Аливаа шилжүүлгийн системийн ажиллагаа нь дор хаяж таван хэсгээс бүрдэнэ.

    морфологийн шинжилгээ;

    лексик шилжүүлэг;

    бүтцийн шилжүүлэг;

    морфологийн үе.

    Морфологийн шинжилгээ. Эх бичвэрийн үгсийг ярианы хэсгүүдээр ангилдаг. Тэднийг илчил морфологийн онцлог. Үгийн лемма нь тодорхойлогддог.

    Лексикийн ангилал. Аливаа бичвэрт зарим үг нь нэгээс олон утгатай байж болох бөгөөд энэ нь дүн шинжилгээ хийхэд тодорхой бус байдлыг үүсгэдэг. Үг хэллэгээр ангилах нь тухайн үгийн нөхцөл байдлыг харуулдаг. Төрөл бүрийн тэмдэглэл, тодруулга хийх боломжтой.

    Лексик шилжүүлэг. Хоёр хэлний толь бичгийн үндсэн дээр үгийн леммауудыг орчуулдаг. Үйлдэл нь үг үсгийн орчуулгатай тун төстэй.

    бүтцийн шилжүүлэг. Өгүүлбэр дэх үгс нь тохирч байна.

    Морфологийн үе. Бүтцийн дамжуулалтын гаралтын өгөгдөл дээр үндэслэн орчуулсан текстийн үгийн хэлбэрийг бий болгодог.

    Трансцендент машин орчуулгын системийн нэг гол онцлог нь эх хэл дээрх текстийн завсрын дүрслэлийг зорилтот хэл дээрх текстийн завсрын дүрслэл рүү "шилжүүлдэг" үе шат юм. Энэ нь хэл шинжлэлийн шинжилгээний хоёр түвшний аль нэгэнд эсвэл хоёуланд нь ажиллах боломжтой.

    1. Гадаргуугийн (синтаксийн) дамжуулалт. Энэ түвшин нь эх хэл болон зорилтот хэлний хооронд "синтаксийн бүтцийг" шилжүүлэх замаар тодорхойлогддог. Итали испани, каталан, франц гэх мэт роман хэл гэх мэт ижил гэр бүлд эсвэл ижил төрлийн хэлүүдэд тохиромжтой.

    2. Гүн (семантик) дамжуулалт. Түвшин нь семантик дүрслэлээр тодорхойлогддог. Энэ нь эх хэлнээс хамаарна. Энэ дүрслэл нь утгыг илэрхийлэх хэд хэдэн бүтцээс бүрдэж болно. Орчуулга нь ихэвчлэн бүтцийн шилжүүлгийг шаарддаг. Энэ түвшинг илүү алслагдсан хэл хооронд орчуулахад ашигладаг.

    Хэл хоорондын машин орчуулга

    Хэл хоорондын машин орчуулга нь машин орчуулгын сонгодог аргуудын нэг юм. эхтекст нь хэлээс хамааралгүй хийсвэр дүрслэл болгон хувиргадаг (шилжүүлэх орчуулгаас ялгаатай). Орчуулсан текстийг энэ дүрслэлд үндэслэн үүсгэсэн. Энэ аргын гол давуу тал нь системд шинэ хэл нэмэх явдал юм. Энэхүү аргын хүрээнд ийм системд зориулж шинэ хэлний орчуулагч бүрийг бий болгох нь жишээлбэл, шилжүүлгийн орчуулгын системтэй харьцуулахад түүний өртөгийг бууруулах болно гэдгийг математикийн хувьд баталж болно. Түүнээс гадна энэ арга нь боломжтой

    · "текстийг дахин ярих", эх бичвэрийг нэг хэлээр орчуулах ажлыг хэрэгжүүлэх;

    · Орос, араб гэх мэт маш өөр хэлийг орчуулах харьцангуй энгийн хэрэгжилт.

    Гэсэн хэдий ч дор хаяж хоёр хэл дээр зөв ажиллах энэ аргын хэрэгжилт хараахан гараагүй байна. Олон шинжээчид ийм хэрэгжих боломжийн талаар эргэлзэж байгаагаа илэрхийлж байна. Ийм системийг бий болгоход тулгардаг хамгийн том бэрхшээл нь хэл хоорондын дүрслэлийн загварт оршдог. Энэ нь хийсвэр, тодорхой хэлнээс хамааралгүй байх ёстой, гэхдээ нэгэн зэрэг одоо байгаа аливаа хэлний онцлогийг тусгасан байх ёстой. Нөгөөтэйгүүр, хиймэл оюун ухааны хүрээнд текстийн утгыг задлах ажил одоогоор шийдэгдээгүй байна.

    Хэл хоорондын хандлагыг анх 17-р зуунд Декарт, Лейбниц нар санал болгож, тоон код ашиглан бүх нийтийн толь бичгүүдийг санал болгосон. Агуй Бек, Афанасий Кирхер, Иоганн Йоахим Бехер зэрэг бусад хүмүүс логик болон дүрс дүрслэлийн зарчимд суурилсан хоёрдмол утгагүй бүх нийтийн хэлийг хөгжүүлэхээр ажиллажээ.

    1668 онд Жон Вилкинс "Жинхэнэ симболизм ба философийн хэлний тухай эссе" зохиолдоо "Интерлингуа"-ынхаа тухай ярьжээ.

    18-19-р зуунд эсперанто гэх мэт олон нийтийн хэлийг хөгжүүлсэн. Машин орчуулгын бүх нийтийн хэлний санаа нь ямар ч байдлаар илрээгүй нь мэдэгдэж байна эрт үе шатуудэнэ технологийн хөгжил. Үүний оронд зөвхөн хос хэлийг авч үзсэн. Гэсэн хэдий ч 1950-60-аад оны үед Кембрижид Маргарет Мастерман, Ленинградад Николай Андреев, Миланд Сильвио Чеккато тэргүүтэй судлаачид энэ чиглэлээр ажиллаж эхэлсэн.

    1970-1980-аад онд энэ чиглэлээр тодорхой ахиц дэвшил гарч, хэд хэдэн машин орчуулгын систем баригдсан.

    Энэхүү орчуулгын аргын хувьд хэл хоорондын төлөөллийг эх хэлээр нь бичвэрийн шинжилгээг дүрслэх арга гэж үзэж болно. Үүний зэрэгцээ текстийн морфологи, синтакс шинж чанар нь дүрслэлд хадгалагдана. Ийм байдлаар орчуулсан текстийг бүтээхдээ "утга"-ыг илэрхийлэх боломжтой гэж үздэг.

    Энэ тохиолдолд заримдаа хоёр хэл хоорондын төлөөллийг ашигладаг. Тэдгээрийн нэг нь эх хэлний онцлогийг илүү тусгасан байдаг. Нөгөө нь зорилтот хэл юм. Энэ тохиолдолд орчуулга хоёр үе шаттайгаар явагдана.

    Зарим тохиолдолд ижил түвшний хоёр буюу түүнээс дээш тооны дүрслэлийг ашигладаг (хоёр хэлтэй ижил төстэй), гэхдээ сэдвийн хувьд ялгаатай. Энэ нь тодорхой текстийн орчуулгын чанарыг сайжруулахад зайлшгүй шаардлагатай.

    Энэ арга нь хэл шинжлэлийн хувьд шинэ зүйл биш юм. Энэ нь хэлнүүдийн ойролцоо санаан дээр суурилдаг. Орчуулгын чанарыг сайжруулахын тулд байгалийн хэлийг өөр хоёр хэлтэй холбох гүүр болгон ашигладаг. Жишээлбэл, украин хэлнээс англи хэл рүү орчуулахдаа заримдаа орос хэлийг ашигладаг.

    Хэл хоорондын машин орчуулгын системийг ашиглахын тулд танд дараахь зүйлс хэрэгтэй болно.

    Текстийг шинжлэх, үүсгэх толь бичиг;

    хэлний дүрмийн тайлбар;

    үзэл баримтлалын мэдлэгийн суурь (хэл хоорондын төлөөллийг бий болгох);

    · Хэл ба дүрслэлд зориулсан үзэл баримтлалын төсөөллийн дүрэм.

    хамгийн их хэцүү мөчЭнэ төрлийг бий болгохдоо өргөн хүрээний мэдлэгийн суурийг бий болгох боломжгүй юм. Мөн маш тодорхой сэдэвт зориулан бүтээгдсэн өгөгдлийн сангууд нь тооцоолох өндөр төвөгтэй байдаг.