Lost In TranslationS .net

Категорія: Машинний переклад · Стрічка новин


Словосполучення машинного перекладу, просто перевірти

Сьогодні, побачив як колега перекладав текст з допомогою гугля-транслятора! Кинувши погляд, зрозумілим стало одне, це мають побачити усі!

Дивіться і усміхайтесь усі, хто вірить у машинний переклад

Читати далі...
Коментарі (0)

Машинний переклад

Машинний переклад
Переважна більшість сучасної техніки розробляється в англомовних країнах, що, з одного боку, змушує користувачів хоча б поверхово орієнтуватися в англомовній термінології, а з іншого – з`являється попит на професійне створення перекладів. З англійської здійснюється ледве не кожен другий переклад у світі. Тому доречним тут виявляється прагнення інформаційної галузі механізувати більшу кількість людських умінь або, інакше кажучи, створити програми машинного перекладу рідною мовою.
Системи машинного перекладу беруть свій початок від часів Чарльза Беббіджа, який першим висловив ідею про можливість машинного перекладу. У 1836–1848 рр. він розробив проект цифрової аналітичної машини – механічного прототипу електронних цифрових обчислювальних машин, що з'явилися через 100 років. Фактично ж історія машинного перекладу починається з "Джорджтаунського експерименту". У січні 1954 р. відбулася перша публічна демонстрація машинного перекладу з російської мови на англійську, здійсненого на машині ІБМ-701. З того часу на проблемою машинного перекладу працювали Д. Панів, І. Бєльська, Н. Трифонов, Л. Корольов, О. Ляпунов та багато інших вчених.
Перше покоління систем машинного перекладу базувалося на алгоритмах послідовного перекладу "слово за словом", "фраза за фразою". Можливості таких систем визначалися доступними розмірами словників, що прямо залежали від обсягу пам'яті комп'ютера. Переклад тексту здійснювався окремими реченнями, значеннєві зв'язки між якими не враховувалися. Такі системи називають системами прямого перекладу. На зміну їм згодом прийшли системи наступних поколінь, у яких переклад від мови до мови здійснювався на рівні синтаксичних структур. В алгоритмах перекладу використовувався набір операцій, що дозволяв шляхом аналізу перекладного речення побудувати його синтаксичну структуру за правилами граматики мови вхідного речення (так само, як вчать дітей мові в середній школі), а потім перетворити її в синтаксичну структуру вихідного речення і синтезувати вихідне речення, підставляючи потрібні слова зі словника. Такі системи називаються Т-системами (Т – від англійського слова "transfer – перетворення").
Найдовершенішим вважається підхід до побудови систем машинного перекладу на основі одержання деякого, незалежного від мов, значеннєвого представлення вхідного речення шляхом його семантичного аналізу. Потім виробляється синтез вихідного речення за отриманим значеннєвим результатом. Такі системи називають І-системами (І – від слова "інтерлінгва"). Вважається, що наступні покоління систем машинного перекладу будуть відноситися до класу І-систем.
Перші комерційні продукти машинного перекладу, що знайшли практичне втілення, з'явилися в середині 80-х рр. Вони були реалізовані на персональних комп'ютерах і були системами прямого перекладу, можливості яких базувалися на величезних (у порівнянні з першими системами) словниках, а не на вмінні аналізувати і синтезувати тексти.
Історія машинного перекладу нараховує не більше 50 років. За цей час змінилося кілька поколінь систем машинного перекладу – від перших програм, що використовували обмежені ресурси універсальних комп'ютерів першого покоління до сучасних комерційних продуктів, що використовують могутні ресурси серверів і персональних комп'ютерів, включаючи ПК, у яких можна розміщувати кишенькові словники, а також комп'ютерні мережі.
У міру зняття технічних обмежень, що накладаються можливостями комп'ютерів по продуктивності й пам'яті, ставало очевидним, що проблема перекладу тексту з однієї природної мови на іншу принципово не зводиться тільки до перекодування слів. Для подолання основних труднощів машинного перекладу повинні бути вирішені проблеми автоматизованого представлення контексту, значеннєвого змісту перекладного тексту, знань про поняття предметної сфери, до якої відноситься перекладний текст.
У 1990 р. Ларрі Чаілдс, фахівець із машинного перекладу, запропонував наступну класифікацію систем машинного перекладу:
1. FAMT (Fully-automated machine translation) - повністю автоматизований машинний переклад;
2. HAMT (Human-assisted machine translation) - машинний переклад за участю людини;
3. MAHT (Machine-assisted human translation) - переклад, здійснюваний людиною з використанням комп'ютера.
Програми машинного перекладу першої з названих категорій є справою далекого майбутнього, оскільки в загальному вигляді не вирішені проблеми автоматичного розуміння, перекладу і синтезу текстів.
Програми другої категорії розробники називають МТ-програми (від Machine translation – машинний переклад). Автоматизований (за участю людини) машинний переклад можливий тільки в умовах штучно обмеженої як за словниковим запасом, так і за граматикою, мови. Як успішний проект МТ-програми, завжди називають німецьку систему Meteo, що виконує переклад метеопрогнозів з французької мови на англійську і навпаки. До МТ-програм належать і продукти машинного перекладу фірми PROMT, згадані вище, у тому числі програми для перегляду вмісту Web-сторінок у мережі Інтернет з метою пошуку потрібного документа.
Програми третьої категорії розробники називають ТМ-програми (від translation memory – пам'ять перекладу). Цю категорію програм застосовують професійні перекладачі, що усвідомили виграш від автоматизації їхньої роботи за допомогою комп'ютерів. Основу ТМ-програм складають спеціалізовані словники, що відповідають тематиці перекладного тексту. При перекладі використовуються конструкції та значення слів і стійких словосполучень, обрані професійним перекладачем і занесені в словникові системи, а отриманий текст піддається інтенсивному редагуванню. Словники і вже перекладені фрагменти текстів, що запам'ятовуються в ТМ-системі, можуть бути повторно використані у великих колективних проектах, ними можна обмінюватися. Тому ТМ-системи – важливий засіб автоматизації праці професійних перекладачів.
Часто ТМ-програми використовують у сполученні з МТ-програмами. Найпопулярнішим у світі ТМ-інструментарієм є Trаnslаtіоn's Workbench фірми Trados (для стислості його часто називають Trados).
Звичайно, безглуздо вимагати, аби програма машинного перекладу видавала повноцінний літературний текст, адже навіть після спілкування з живою людиною редакторові є над чим попрацювати. В особливих випадках приблизно 10 % оброблюваної інформації потребує заглядання в словники-довідники та консультацій з фахівцями.
На сучасному українському ринку представлені такі комерційні продукти машинного перекладу:
– "Vista Technologies" і "Adventis", створені в 1991 р.;
– ПРОМТ, розроблена також в 1991 р.;
– "Media Lingva".
Продукт Retrans Vista фірми "Vista Technologies" призначений для автоматизованого перекладу текстів з російської мови на англійську і навпаки. У ньому використані оригінальні алгоритми стиснення словникових баз і пошуку перекладних еквівалентів, що дозволяють транслювати "на льоту" не тільки фрагменти тексту, імпортовані з текстового редактора MS Word, але і Web-сторінки. Особливіcтю цього продукту є програма концептуального аналізу, що автоматично виділяє з тексту нові словосполучення і включає їх у словник. Основні словники системи Retrans Vista містять терміни і фразеологічні одиниці з природничих і технічних наук, економіки, бізнесу та політики. Обсяг політематичного машинного словника – близько 3,4 млн. слів, причому 20 % з них є словами, а 80 % – стійкими словосполученнями.
Фірма PROMT розробила і поставляє інтернет-перекладач PROMT Internet Translation Server, що забезпечує переклад "на льоту" Web-сторінок, запитів до пошукових систем чи до баз даних, представлених в Інтернеті. Модуль перекладу PROMT Internet вбудовується в браузер Microsoft Internet Explorer, утворюючи засіб для синхронного перекладу Web-сторінок Web View. При цьому можна встановлювати для перекладу різні мовні пари: англійська – російська; англійська – німецька; англійська – іспанська; французька – англійська; французька – німецька. Безкоштовний on-line перекладач PROMT є доступним в Інтернеті. PROMT Internet Translator Server встановлений на пошуковій системі Voila, що належить оператору France Telecom.
Компанія "Медіа Лінгва" випустила електронні словники серії "Мультилекс 3.5. Новий великий англо-російський словник" і "Мультилекс 3.5. Англійська. Економіка і право". Такі словники, що працюють під керівництвом операційних систем Windows CE чи PalnOS, можуть бути розміщені на кишенькових комп'ютерах.
Машинні словники мають велику трудомісткість і цінність. Чи не тому їх творці не прагнуть стандартизувати формати даних, тому що побоюються незаконного використання конкурентами? Дуже привабливий компромісний вихід – поступове наповнення словника на конкретному текстовому матеріалі шляхом напівавтоматичного запам'ятовування незнайомих слів. Це найбільш "чисте" втілення моделі навчання під час практичної діяльності. Однак за оперативним запам'ятовуванням обов'язково повинен іти етап аналізу нових слів і оснащення їх повним граматичним апаратом.
Саме для інформаційної галузі характерне найбільше утворення неологізмів, і перекладачу доводиться знаходити й утворювати їм відповідники, тобто займатися словотвором. Адже часто в нашій мові відсутній відповідник, скажімо, англійському слову через те, що в українській мові відсутнє ще саме тлумачення, процес, який слід виразити якимось одним словом. Відзначимо, що в більш розвинутих країнах існують фонди національних мов і навіть закони про однаковість перекладу неологізмів, що є практичним вираженням любові до національної культури. Тобто система машинного перекладу повинна прагнути до джерел, відновлення, нарешті, до сайтів рідної мови.
У проблемі українізації інформаційних засобів можна зайняти дві позиції: перша – не звертати уваги на нові технології, гадаючи, "що моя хата скраю...", що якось воно там само собою станеться, або ж, це другий варіант – щодня і щогодини змушувати себе і своїх близьких працювати, творячи й приживляючи нові назви понять українською мовою. Звичайно, другий варіант набагато складніший за перший, але й, можливо, цікавіший. Ми будемо в курсі нововведень, будемо причетні до творення нової технічної української мови. Задля виведення української мови, а разом з тим й української держави на новий рівень визнання в світі слід добре попрацювати всім загалом і кожному зокрема.
Використано матеріали статті О.В.Кудіної.


Цікаве про машинний переклад у світі
• За останні кілька років відзначається небувалий ріст інтересу до машинного перекладу, який в основному зв'язують із розвитком Інтернету.
• Ніколи раніше машинний переклад не був відомий настільки широкому колу користувачів.
• За період 1978-93 у США на дослідження в зоні МП витрачено 20 мільйонів доларів, у Європі - 70 мільйонів, у Японії - 200 мільйонів.
• У США склалися особливі відносини між розроблювачами систем МП і урядом, який вважає машинний переклад "ключем в інформаційне століття". Особливо важливим уважається використання систем МП у наукових дослідженнях, охороні здоров'я, у зоні високих технологій, охорони навколишнього середовища.
• Особливе значення надається тестуванню систем перекладу з метою виявлення шляхів і перспектив їх розвитку. З 1994 року регулярно проводяться спеціальні форуми по обговоренню методик тестування систем МП.
• Відзначається, що на зміну колишній концепції, пов'язаної з ейфорією перших результатів - "якісний машинний переклад", прийшла нова - "якісний чорновий машинний переклад", що формує правильні очікування.

Деякі важливі дати в історії МП:

1947 - дата народження машинного перекладу, як наукового напрямку. Уоррен Уївер, директор відділення природничих наук Рокфеллерівського фонду, написав лист Норберту Вінеру, у якому розглядав завдання перекладу текстів з одних мов на інші, як ще одну зону застосування техніки дешифрування. За цим листом пішла безліч дискусій.
1947 - А.Бут і Д.Бриттен розробили докладний "код" для послівного машинного перекладу.
1948 - Р.Риченс запропонував правила розбивки словоформ на основу й закінчення.
1952 - представлена перша система МП - IBM Mark II - російсько-англійська, мала словник в 250 одиниць і 6 граматичних правил. десятиліття, що пішло за цим, було часом бурхливого розвитку МП.
1954 - представлена перша система МП - IBM Mark II – російсько-англійська зі словником у 250 одиниць та 6 граматичних правил. Наступне десятиліття було періодом бурхливого розвитку МП.
1967 - спеціально створена в США Комісія Національної Академії наук, виходячи з реальної ситуації з перекладами в США й показників вартості різних засобів перекладу, дійшла висновку, що машинний переклад нерентабельний. Доповідь суттєво загальмувала розвиток МП у цілому.
70-і роки - новий підйом робіт у зоні МП. З розвитком обчислювальної техніки з'явилися нові можливості машинної реалізації лінгвістичних алгоритмів.
80-і роки - час роботи персональних комп'ютерів значно подешевшав, машинний переклад нарешті став економічно вигідним.
90-і роки - відзначається черговий ріст інтересу до машинного перекладу, що пов'язаний з появою й бурхливим розвитком Internet/Intranet. Переваги використання машинного перекладу особливо очевидні при одержанні on-line перекладу.


Miss

Коментарі (0)