Битката е изгубена. Грабвайте телата!

Как ИИ угищожва бългаския език: автоматичен превод

Автоматичните преводачи: приятели или врагове?

Изгубих надежда. Изкуственият интелект ще победи дори естествената тъпота. Това е толкова сигурно, колкото факта, че великаните на Дон Кихот са мелници. Не само защото в безграничното интернет пространство всеки се изживява като всичко и публикува каквото му харесва.

Всъщност точно заради това — всеки ден ни заливат всякакви текстове, преведени автоматично, заедно с всякакви текстове, написани автоматично. Ясно е, че няма никаква надежда и смисъл да се борим с това. Новото поколение е израснало с клипчета и картинки, в най-добрия случай има 3 по български, смята, че „й“ е окончание за множествено число, половината българи живеят в чужбина и и т.н. и т.н. Как да пише, като дори не може да чете?!

Пишем като автоматични преводачи

Изкуственият интелект е доста хитро изобретение на нечий естествен ум. Предлагаш на вече и без това отучените от писане и четене хора модел, благодарение на който и те могат да блеснат като пишещи и си готов! Научил си ги и да мислят изкуствено и автоматично. Превърнал си едното в  другото. На принципа на най-малкото съпротивление и пестенето на енергия, казано иначе благодарение на присъщия на всички нас мързел, напоследък навсякъде ври и кипи от премъдрости, философски прозрения, житейски съвети, дълбокомислени притчи и всякакви други откровени глупости, които дори изобщо не са само преводни. Те вече си се пишат изначално от ИИ.

И понеже са навсякъде, хората приемат „езиковия им модел“ (извинете за сложния израз, без да искам) за стандарт. Днес дори говорят така, все едно четат написан от ИИ текст. Не сте ли забелязали?

Автоматичните преводачи, които бяха първопроходниците на всякакви автоматични писания, са всъщност нещо много полезно. Когато човек превежда дълги текстове е много удобно да ги ползва, защото те „печатат“ вместо него. Разбира се, след това човекът трябва да прочете, да поправи, да подобри, да редактира. Защото в главата на човека са заложени всички особености на неговия роден език, характерните начини на изразяване, типичните граматични конструкции, стандартният строеж на изречението и т.н. Тези неща не са заложени в машините. Т.е. те са заложени, но за „базовия“ език на програмиране, т.е. английски. За нашият „малък“ език няма и да бъдат скоро заложени, защото машините са така проектирани, че да се „учат“ от нас.

Чукча – не читатель, чукча – писатель

Тук се крие и същността на проблема. Просто е: машините не се учат от нас, понеже ние се учим от тях. Езикът в основата на всяка една пишеща машина е английският, поради тази причина тя превежда и пише по модела на този език. Ако този, който я ползва, внася редакции и промени в текста, тя, или поне по-умните, „запомнят“ и „поправят“ грешките си, променят езиковия модел и правила (това е доста по-трудно) и със сигурност променят превода на определени думи. С тях е най-лесно. Просто заменят „стартирам“ със „започвам“ и готово.

Да, но някой трябва да им каже. Обаче няма кой. Чукча не е читател, чукча е писател. Този, който е решил да блесне с някоя велика ню ейдж притча с дълбока философска поука няма време за четене. Той си пуска машинката да му я преведе, понеже най-вероятно и той самият въобще не я разбира, след което я плясва на стената и започват да се сипят лайкове, ах, ох, въй, споделяния и … ставаме инфлуенсъри. Вече даже се плаща за тая работа. Какво тук значи някаква си дума, или някаква си граматическа конструкция?! Какво тук значи някакъв си език?! Важното е, че вече всички разбираме и превеждаме всичко, как няма значение.

„Реч на мама и на татка“

Така, пост след пост, бедният език „на мама и на татка“ постепенно се огъва под натиска на машинния такъв и крее и линее. Ако се заслушате в начина, по който се говори по телевизията да речем, ще чуете как вече никой не замества пълните форми на местоименията, а всичко е моето, твоето, тяхното, без значение, че ще се повтори 10 пъти в едно изречение.

„Докато не е“ изчезнал съвсем езикът ни, послушайте, „преди да“ е станало късно и  формата, с която започнах изречението, не се е превърнала в архаизъм. Всичко е вече „преди да“. „Докато не“ е аут. Аут са всички прекрасни, очарователни отрицателни конструкции на езика ни, така добре изразяващи българския опак характер. Имаме бегла идея за това, въпреки че „нямаме никаква“ представа. Всякакви типично английски конструкции, няма да ги изброявам, няма смисъл, се ползват буквално преведени и без никаква редакция ежедневно от високопоставени политици, журналисти и прочее „примери за подражание“.

Видяла жабата, че подковават вола…

Примерът се подема и също като жабите вдигаме крак, като видим, че подковават коня. Все едно сме нация от няколко милиона папагали. Възпроизвеждане, повторение до втръсване, едно и също, едно и също, едно и също. Клише до шаблона, мила моя майно льо.

Аз винаги се чудя защо, тъй като в официалния портал на ЕС например, 99% от преводите са на съвършено професионално ниво и на прекрасен български език. Колегите се стараят да следват един от основополагащите принципи на ЕС – „единни в многообразието“ и да „съхраняват разнообразието на езиците“. Определено там българският език е български, а не някакъв англо-есперантски. Значи журналисти и политици просто си „гепват“ някакви развявани като байрак ключови думи и изрази, заглавия и т.н., най-вероятно от някой англоезичен източник, превеждат си ги буквално, блесват с купешки фрази „на телевизора“, след което те влизат в устата на средностатистическия българин и стават стандарт. Да добавя отново, че източниците определено не са на български. То кой ще се занимава с четене, няма време.

ИИ не се учи от нас, ние се учим от него

Съвършено ясно е вече че, българският ИИ не се учи от нас, а ние се учим от него. Дори ни и харесва, комай. Вече навсякъде чувам „наслаждавам се“, „принадлежа тук“, „адресирам проблем“, и т.н. и т.н. И това е само на повърхността, това са само думи, а под тях са всички езикови средства. Ако се заслушате, ще чуете, че „миналото незапомнено“ постепенно изчезва и се ползва най-обикновено минало време—говоря за времето „на л“, което показва, че говорещия не е биЛ свидетел на дадено събитие. Ще чуете, как много често изреченията започват с „обстоятелствено пояснение за време“, т.е. времето на дадено събитие, а не със самото събитие. Англичаните обичат така, „в 5 часа пият чай“. При тях по принцип времето стои на първо място в изречението. „Вчера направих еди какво си, днес еди що-си“ и т.н. В българския, освен ако не е заглавие или продължение на вече започната тема, т.е. в контекст, това е странно. Не може първото ти изречение в разказ за нещо да е „Преди 50 години беше написана книгата“. Някак си не звучи както трябва на български, не мислите ли? Но ако слушате като мен, ще чуете, че все по-често „се случват“ такива изречения…

И ще завърша с най-новия ми любимец. Знам, че съм на „грешния“ адрес и говоря на „грешните хора“. Исках да кажа, че съм сбъркала адреса и съм объркала хората, не се насочвам към правилните хора. Но вече всичко живо е „грешно“ забелязали ли сте? Естествено, че това е буквален превод на англоезичните конструкции, който е станал стандарт и за нас. И по новините дори е нормално да се говори за „грешни“ неща и т.н. Никой не обърква нищо, не действа неправилно. Всеки е направил грешното нещо или е отишъл при грешните хора, взел е „грешни“ решения…

Тук мога да изнеса цяла лекция за това как езикът определя съзнанието и светогледа ни, но няма, защото е грешната тема. Никой не го интересува, това просто не е важно. Дори и за патриотичните организации, които също говорят така.

Надежда всяка тука оставете

Тъжно, родна реч, омайна, сладка, що (вече не) звучи навред край мен“… но факт. Безнадеждно е. Грешната кауза съм си избрала. Обаче ще си мрънкам. Ей така, за собствено успокоение. И за да може след време езиковите археолози да видят (евентуално), че е имало поне един Мунчо като мен, поне един, за който да кажат „тоя луд беше единственият човек, който се осмели да протестира.“

Ако има и други луди – грабвайте телата.

ПТП (просто тъп превод)

Как да (не) превеждаме все едно „не сме оттук“

устойчиви изрази

ИИ е преводач. Изкуствен, но неинтелигентен.

Отдавна смятам да се захвана с тази тема, но не зная откъде да започна. Рядко ми се случва да не ми достигат думи просто защото имам твърде много за казване.

Да започна първо от себе си — аз съм професионален преводач и смея да твърдя доста добър. За съжаление не превеждам често художествена литература, да не кажа почти никак, така че не съм сред познатите имена. Това обаче не ми пречи да имам безкрайно изострени сетива към проблемите, които преводът създава в езика ни. Казах преди малко, че съм добър преводач. Това е един от малкото таланти, с които ме е дарил Господ — да намирам най-добрия начин да предам на български нещо, казано на английски. Добра съм не защото знам до съвършенство английски, а защото боравя на достатъчно високо ниво с българския. Това впрочем е най-важното условие в преводаческия свят. Езикът, на който превеждаш, трябва да ти бъде или майчин, или да го говориш на близко ниво. Ние, хората, които сме в преводаческия „бизнес“ от миналия век сме наясно това, затова ни най-малко не ни притеснява фактът, че може да не знаем всяка дума или израз на изходния език, понеже със сигурност ще открием начина да я предадем най-добре на родния си.

Преводачите на новия век обаче, които са в болшинството си Изкуствено Интелигентни, понеже си служат с виртуални софтуери, които приемат на пълно доверие, не го знаят. Техният майчин език е английски, тъй като той е изходният за всеки автоматичен преводач, и въобще не ги вълнува, че може да не знаят някоя дума или израз на български, защото със сигурност има начин да си я оставят както си е на английски, просто с български букви.

Качество на превода ли, чистота на езика, естествено звучене, обичайни конструкции, устойчиви словосъчетания, фразеологични изрази, я стига, какви са тия глупости! Днешният човек е виртуален, той се оправя из кибер пространството много по-добре отколкото из дебрите на собствения си език, така че я не ни занимавайте! На кого му пука! На разработчиците на преводачески софтуер със сигурност не, защото колкото по-малко „целеви“ езици, толкова по-малко инвестиции. Както е тръгнало, в най-скоро време ще има поне един език по-малко, в който да влагат усилия — българският.

Най-тъжното е, че независимо от нарастващия брой патриотични татуировки, тези, които ги боли сърцето от това се броим на пръсти. Патриотизмът в наше време е нещо доста модерно, не разбирам обаче защо на никого не му е хрумнало, че едно от първи измерения е езиково. Тук не можем да обвиним дори и стандартния виновник за хала ни – ЕС, защото там се полагат всички усилия за подпомагане на културните различия и езиково разнообразие, видимо дори и в преводната им политика. В политиката на ЕС се отдава особено голямо значение на това всички документи да звучат по възможно най-добрия начин на отделните европейски езици. Нашата собствена политика обаче в тази насока липсва. Очевидно за българина не е от никаква важност да поддържа и опазва езика си, още по-малко го интересува пък как му се поднасят преводните продукти. Още по-тъжното е, че това не само че не го вълнува, а дори охотно възприема съвършено чужди за характера си думи и изразни прийоми. Нехайството е толкова голямо , че най-древният писмено засвидетелстван славянски език, оцелял повече от 11 века –казвам 11 предвид най-древните открити артефакти, написани на български — започва все повече да губи плът и кръв. Казано по-точно доброволно се самоубива, понеже неговите собствени носители пет пари не дават за него. Неговите собствени носители доброволно заменят отличителните му особености, изрази, словосъчетания и т.н, със специфичните за майчиния език на изкуствения интелект. Така го унищожават, дори и да говорят без чуждици.

Спирам с общите приказки и започвам с примерите. Всички примери, които ще преведа по-долу, са вече придобили гражданственост грешни преводи, измествайки изконните си български побратими от главите на говорещите.