Как поступить
в Онлайн-школу и получить аттестат?

Подробно расскажем о том, как перевестись на дистанционный формат обучения, как устроены онлайн-уроки и учебный процесс, как улучшить успеваемость и повысить мотивацию!

Нажимая на кнопку, я соглашаюсь на обработку персональных данных

Конспект урока: Распознавание текста и системы компьютерного перевода

Обработка информации

18.04.2024
1398
0

Распознавание текста и системы компьютерного перевода

 

План урока

 

  • Программы оптического распознавания текста
  • Компьютерные словари и программы-переводчики

Цели урока

 

  • знать основные функции программ распознавания документов
  • знать принцип работы компьютерных словарей и программ-переводчиков
  • уметь приводить примеры программ распознавания документов, программ-переводчиков

Вступление

 

За многовековую историю человечество накопило огромное количество знаний, большая часть из которых хранится на бумажных носителях. При создании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат, при переходе предприятий от бумажного к электронному документообороту используют системы оптического распознавания символов.

 

В памяти компьютера можно сохранить огромное количество информации, что позволяет создать электронные словари, которые обеспечивают не только перевод информации, но и орфографическую проверку написания слов на различных языках.

 

Программы оптического распознавания текста

 

Иногда возникают ситуации, когда отсканированный и сохранённый в памяти компьютера документ необходимо подправить, внести дополнительную информацию. Но как это сделать, если перед нами отсканированное изображение, а не текстовый документ? Возникает проблема: отсканированный документ есть изображение, состоящее из точек (пикселей), а не из текста. Перепечатка текста займёт слишком много времени, поэтому были разработаны специальные прикладные программы распознавания символов и текста. 


Программы распознавания символов и текста  — это программы, с помощью которых осуществляется ввод больших текстов в память компьютера путём распознавания текста.


Рис. 1. Программа для распознавания текста
Наиболее широко известна и распространена программа ABBYY FineReader (рис. 1).

 

Из рисунка видно, какие операции может выполнить данная программа:

  • сканировать в MS Word;
  • файл (PDF/изображение) в MSWord;
  • сканировать и сохранить изображение;
  • сканировать в PDF с возможностью поиска;
  • фото в MS Word.

ABBYY FineReader может распознать информацию на 179 языках, включая случаи использования сразу двух языков в тексте. В процессе работы текст проверяется на орфографию, а результаты могут быть экспортированы в различные программы, например, MS WordExcelPowerPoint или Outlook.

 

Преобразование бумажного документа в электронный вид происходит в пять этапов:

  1. Сканирование документа (кнопка Сканировать).
  2. Сегментация документа (кнопка Сегментировать) — разбиение страницы на блоки текста.
  3. Распознавание документа (кнопка Распознать).
  4. Редактирование и проверка результата (кнопка Проверить).
  5. Сохранение документа (кнопка Сохранить).

Компьютерные словари и программы-переводчики


Компьютерные словари  предназначены для перевода текста с одного языка на другой.


В настоящее время существует огромное количество компьютерных словарей, включающих в себя десятки тысяч слов и выражений.

 

Компьютерные словари представляют собой быстро работающую компьютерную программу, имеющую поиск, в то время как бумажный эквивалент будет иметь вид толстой книги, в которой долго и проблематично искать необходимый перевод слова.

 

Компьютерные словари включают в себя:

 

  1. Множество языков для перевода информации;
  2. Словари, содержащие переводы специфических терминов из различных областей знаний (техника, медицина и др.);
  3. «Быстрый набор» — выпадающий список похожих слов, словосочетаний;
  4. Воспроизведение слов (не во всех).

 

Компьютерные словари можно установить на компьютер или мобильное устройство. Также можно использовать on-line версии словаря в сети Интернет.


Для перевода текстовых документов применяются 

программы-переводчики , которые могут оказать огромную помощь в обработке информации на иностранных языках по различным отраслям знаний.


В настоящее время наиболее распространёнными программами машинного перевода являются системы PROMTStyliusСократMagic Gooddy и др.

 

Минусы компьютерного перевода:

  • иногда допускают смысловые и стилистические ошибки;
  • неприменимы для перевода художественных произведений.


Контрольные вопросы

 

1. Каким образом происходит распознавание символов и текста?

2. Перечислите этапы распознавания текста с помощью программы ABBYY FineReader.

3. Есть ли у компьютерных словарей преимущества по отношению к бумажным словарям?


Предыдущий урок
Оформление реферата «История вычислительной техники»
Обработка информации
Следующий урок
Создание графических изображений
Обработка информации
Урок подготовил(а)
teacher
Иван Андреевич
Учитель информатики
Опыт работы: 7 лет
Поделиться:
  • Мы — многонациональный народ

    Обществознание

  • Формирование изображения на экране компьютера

    Информатика

  • Человек и млекопитающие

    Биология

Зарегистрируйся, чтобы присоединиться к обсуждению урока

Добавьте свой отзыв об уроке, войдя на платфому или зарегистрировавшись.

Отзывы об уроке:
Пока никто не оставил отзыв об этом уроке