Постредактирование для казахского языка

Post-editing for the kazakh language

Авторы

  • Zbigniew Omiotek Lublin University of Technology, Lublin, Poland https://orcid.org/0000-0002-6614-7799
  • Diana Rakhimova Al-Farabi Kazakh National University, Almaty, Kazakhstan
  • Aliya Zhunussova Al-Farabi Kazakh National University, Almaty, Kazakhstan

Аннотация

Современный мир и наше ближайшее будущее зависят от прикладных интеллектуальных систем, так как новые технологии развиваются каждый день. Одной из задач интеллектуальных систем является машинный (автоматизированный) перевод с одного естественного языка на другой. Машинный перевод (МП) позволяет людям общаться вне зависимости от языковых различий, так как снимает языковой барьер и открывает новые языки для общения. Машинный перевод — это новая технология, особая ступень в развитии человечества. Этот вид перевода может помочь, когда вам нужно быстро понять, что ваш собеседник написал или сказал в письме.

Работа онлайн-переводчиков используется для перевода на казахский язык и наоборот. Выявляются ошибки перевода, приводятся общие преимущества и недостатки онлайн-систем машинного перевода на казахский язык. Представлена ​​модель разработки системы постредактирования машинного перевода для казахского языка.

OpenNMT (Open Neural Machine Translation) — это система с открытым исходным кодом для нейронного машинного перевода и обучения нейронных последовательностей. Для изучения языков в OpenNMT нужны параллельные корпуса для языковых пар. Преимущество OpenNMT в том, что его можно применять ко всем языкам и обрабатывать большие корпуса. Экспериментальные данные были получены для англо-казахской языковой пары. Прикладные интеллектуальные системы играют важную роль в современном мире. Одной из их задач является машинного перевода (МП)  перевод с одного языка на другой. МТ позволяет людям свободно общаться, несмотря на языковые барьеры. Эта новая технология — особый шаг, помогающий понять, что собеседник говорит или пишет вам. Автоматическое постредактирование — это задача исправления ошибок, возникших в текстах в результате машинного перевода. Так как МП не всегда может дать желаемый результат, возникает необходимость редактирования перевода. Недостатки перевода приходится устранять постредактированием. Эта потребность в постредактировании во многом определяется качеством машинного перевода: некачественный перевод оставляет много места для постредактирования, а качественный и человеческий перевод требует минимального редактирования текста. В данной работе описывается разработка легкого модуля постредактирования для англо-казахских языковых пар. Модель нейронной сети обучается на парах mt, pe и триплетах src, mt, pe с использованием фреймворка OpenNMT. Затем сравниваются результаты метрик BLEU mt - pe и mt - ape и делается вывод о качестве постредактирования.

Скачивания

Данные скачивания пока недоступны.

Загрузки

Опубликован

2022-06-27 — Обновлена 2022-06-28

Версии

Как цитировать

Omiotek, Z., Rakhimova, D., & Zhunussova, A. (2022). Постредактирование для казахского языка: Post-editing for the kazakh language. ADVANCED TECHNOLOGIES AND COMPUTER SCIENCE, 2, 20–28. извлечено от https://atcs.iict.kz/index.php/atcs/article/view/75 (Original work published 27 июнь 2022 г.)

Выпуск

Раздел

Технологии искусственного интеллекта