URSS.ru - Издательская группа URSS. Научная и учебная литература
Об издательстве Интернет-магазин Контакты Оптовикам и библиотекам Вакансии Пишите нам
КНИГИ НА РУССКОМ ЯЗЫКЕ


 
Вернуться в: Каталог  
Обложка Пестрякова Н.В. Метод распознавания символов, основанный на полиномиальной регрессии
Id: 218810
 
276 руб.

Метод распознавания символов, основанный на полиномиальной регрессии. Изд.стереотип.

URSS. 2016. 144 с. Мягкая обложка. ISBN 978-5-396-00749-9.

 Аннотация

Целью настоящего издания является обобщение результатов, полученных автором в области распознавания печатных и рукопечатных символов начиная с 1999 г. и опубликованных в открытой печати в серии статей. В монографии излагаются теоретические основы и аспекты практического применения разработанного автором метода распознавания, описываются характеристики качества программной реализации метода, производится сопоставление с характеристиками известных алгоритмов распознавания. Описаны предложенные автором подходы к изучению свойств оценки распознавания и исследованию качества распознавания в зависимости от степени различия баз обучения и распознавания.

Читателю предлагается по-новому взглянуть на проблему распознавания, ознакомиться с полученными в ходе численных экспериментов результатами и их трактовкой. Книга содержит большой объем фактического материала, оформленного в виде графиков, диаграмм и таблиц.


 Оглавление

Введение
Глава 1 Метод распознавания: теоретические основы, практическая реализация, характеристики
 1.1.Математическая постановка задач обучения и распознавания согласно методу полиномиальной регрессии
  1.1.1.Краткая история вопроса
  1.1.2.Математическая постановка задачи
  1.1.3.Метод наименьших квадратов
  1.1.4.Метод полиномиальной регрессии
  1.1.5.Вычисление матриц
  1.1.6.Практическое нахождение матрицы А
 1.2.Метод "полиномов" и его практическая реализация
  1.2.1.Общие замечания
  1.2.2.Построение вектора x
  1.2.3.Практическая реализация
 1.3.Характеристики метода полиномов
  1.3.1.Основные понятия
  1.3.2.Печатные прямые буквы и цифры
  1.3.3.Печатные прямые и курсивные цифры
  1.3.4.Рукопечатные цифры
 1.4.Обсуждение результатов
Глава 2 Закономерности в распознавании
 2.1.Распознавание символов обучающей базы
  2.1.1.Общие замечания
  2.1.2.Поведение оценки распознавания в терминах растров
  2.1.3.Поведение оценки распознавания в терминах полиномиальных векторов
  2.1.4.Сравнение поведения оценки распознавания в терминах растров и полиномиальных векторов
  2.1.5.Оценка распознавания для "1". Выделение двух подбаз
  2.1.6.Оценки. От хаоса к структуре
  2.1.7.Выводы
 2.2.Распознавание среднестатистических растров и векторов
  2.2.1.Оценки и контрастность распознавания
  2.2.2.Расстояния между среднестатистическими растрами и векторами различных символов
  2.2.3.Связь между распознаванием и степенью близости к среднестатистическим растрам и векторам
  2.2.4.Выводы
Глава 3 Печатные и рукопечатные символы
 3.1.Распознавание печатных и рукопечатных символов
  3.1.1.Особенности обучения и распознавания
  3.1.2.Зависимость оценки распознавания от величины отклонения растра изображения символа от среднестатистического растра
  3.1.3.Зависимость оценки распознавания от величины отклонения полиномиального вектора изображения символа от среднестатистического вектора
  3.1.4.Расположение правильно, неправильно распознанных и "чужих" символов в терминах растров и полиномиальных векторов
  3.1.5.Выводы
 3.2.Модели "затемнения" и "засветления"
  3.2.1.Описание моделей и некоторые замечания
  3.2.2.Интегральные характеристики модифицированной базы. Сравнительный анализ при затемнении/засветлении и различных типах написания символов
  3.2.3.Качество распознавания. Сравнительный анализ при затемнении/засветлении и различных типах написания символов
  3.2.4.Корреляция качества распознавания и векторной интегральной характеристики модифицированной базы при засветлении для рукопечатных символов
  3.2.5.Корреляция качества распознавания и векторной интегральной характеристики модифицированной базы при затемнении для рукопечатных символов
  3.2.6.О качестве распознавания и интегральных характеристиках модифицированной базы при засветлении и затемнении для печатных символов
  3.2.7.О сильном затемнении и засветлении
  3.2.8.Дифференциальные характеристики модифицированной базы
  3.2.9.Динамика дифференциальных характеристик модифицированной базы при засветлении для печатных и рукопечатных цифр
  3.2.1 .Корреляция качества распознавания, векторных интегральных и дифференциальных характеристик модифицированной базы при засветлении рукопечатных символов
  3.2.11.Динамика дифференциальных характеристик модифицированной базы при затемнении для печатных и рукопечатных цифр
  3.2.12.Корреляция качества распознавания, векторных интегральных и дифференциальных характеристик модифицированной базы при затемнении рукопечатных символов
  3.2.13.Сравнительный анализ интегральных и дифференциальных характеристик при затемнении и засветлении для печатных и рукопечатных символов
  3.2.14.Расстояние между растрами "Белого" и "Черного" квадратов. Рукопечатные и печатные символы
  3.2.15.Выводы
 3.3.Модель "дискретизации"
  3.3.1.Описание модели. Представление дискретизации в виде комбинации затемнения и засветления
  3.3.2.Анализ табличных и графических данных. Согласованность характеристик качества распознавания для дискретизации с соответствующими величинами для затемнения и засветления
  3.3.3.Выводы
Заключение
Литература

 Введение

Задача распознавания печатных и рукопечатных (написанных от руки сходно с печатным начертанием) символов весьма актуальна для различных видов современных наукоемких технологий, использующих процесс оптического ввода (распознавания) документов, например для автоматической обработки платежных ведомостей в банках, результатов анкетирования или голосования, пенсионных форм и т.д. Область применения распознавания символов постоянно расширяется. Существенный прогресс в решении этой задачи наблюдается в последние годы благодаря развитию современных точных методов. Одним из них является регрессионный анализ, применению которого посвящена настоящая работа. В ней приведены частные, но, как показал опыт, весьма эффективные приложения полиномиальной регрессии к задаче распознавания.

Постановка задачи осуществлялась с привлечением книги Шурмана [4]. Эта книга вызывает несомненный интерес, но содержит лишь общие сведения (формулы, рассуждения и т.д.) и никак не является практическим руководством по распознаванию на основе полиномиальной регрессии из-за отсутствия конкретных сведений о структуре используемых многочленов, а также ввиду рассмотрения растров 2х2, весьма далеких от реальных жизненных ситуаций.

За прошедшее время разработанный метод был обучен и проверен на различных базах символов (печатные прямые буквы и цифры, печатные прямые и курсивные цифры, рукопечатные буквы и цифры, рукопечатная латиница).

Практика показала, что он удовлетворяет высоким требованиям по качеству распознавания, быстродействию, монотонности оценок. Метод хорошо зарекомендовал себя при распознавании сильно зашумленных изображений (загрязненные и в значительной степени разрушенные вагонные номера).

Разработанный алгоритм распознавания печатного и рукопечатного написания на базах графических символов с известными границами оформлен в виде библиотеки программ, состоящей из двух частей: обучения (с возможным дообучением) и распознавания для платформ Windows2000 / WindowsXP / Windows Vista / Windows 7. Библиотека готова к практическому использованию.

Данный метод в течение ряда лет применяется в качестве одного из базовых методов распознавания рукопечатных цифровых реквизитов в одной из промышленных систем распознавания сложноструктурированных документов.

Высочайшая монотонность оценок, генерируемых данным методом, позволяет использовать его в промышленной технологии стендирования распознавания печатных и рукопечатных документов как с известным заранее описанием структуры, так и без него.

Вычислительная структура метода полиномиальной регрессии обеспечивает возможность глубокого мелкозернистого (fine gained) распараллеливания. С появлением и распространением технологий nVidia CUDA, ATI Stream, OpenCL и Microsoft DirectCompute это становится важным преимуществом метода при распараллеливании как средствами CPU (центрального процессора), так и с помощью GPU (средств графических карт). Относительное увеличение скорости для рассмотренного метода составляет 25--28 раз.

Из вышесказанного становится очевидным, что за этим методом будущее, поскольку ускорение путем распараллеливания снимает ограничение на использование более сложных конструкций в рамках данного подхода.

В гл.1 рассмотрены теоретические основы и аспекты практического применения метода распознавания образов печатных и рукопечатных символов, основанного на полиномиальной регрессии. Описываются характеристики качества программной реализации метода, определенные на базах графических образов символов с известными границами. Производится сопоставление с характеристиками известных алгоритмов распознавания символов, таких как нейронные сети и алгоритм сравнения с эталонными образами.

В гл.2 показано наличие закономерностей в выставлении оценок распознавания. Введены понятия "среднестатистического" растра и вектора. Выявлены особенности распознавания их самих. Выполнен анализ характера распознавания в контексте этих величин. Изучено поведение оценки распознавания при увеличении "расстояния" между полиномиальным вектором/растром, построенным по изображению символа, и среднестатистическим вектором/растром этого символа по базе. Рассмотрен механизм формирования оценки как структуры из ряда случайных событий. Результаты получены на базе рукопечатных цифр, которая используется как для обучения, так и для распознавания.

В гл.3 проведено сравнение закономерностей в выставлении оценок распознавания для печатных и рукопечатных цифр. Для каждого из символов найдено расположение правильно, неправильно распознанных его изображений, а также образов символов, отличных от данного. Введены понятия мелко-, средне- и крупномасштабных явлений при описании данного метода распознавания. Показано наличие структур на средне- и крупномасштабном уровнях. Разработан подход к исследованию зависимости качества распознавания от степени различия между базой обучения и полученной путем ее модификации базой распознавания. Изучена корреляция динамики среднестатистических величин (растров и полиномиальных векторов), а также качества распознавания в процессе изменения базы печатных и рукопечатных цифр.

Инициатором издания данной книги был профессор Н.Е.Емельянов. К великому сожалению, этого достойнейшего человека уже нет с нами. Николай Евгеньевич проявлял искренний интерес к моим публикациям и высказал ряд рекомендаций по обобщению полученных результатов.

Моральная поддержка в проведении исследований, обсуждения, советы и доброжелательное отношение к издательскому проекту со стороны чл.-корр. РАН проф. В.Л.Арлазарова и чл.-корр. РАН проф. Ю.С.Попкова сыграли важную роль в судьбе рукописи.

Моя деятельность в области распознавания была начата благодаря дружескому участию А.В.Мисюрева.

Следует подчеркнуть, что наиболее существенные основополагающие результаты были получены вместе с моим постоянным соавтором М.Б.Гавриковым.

На различных этапах работы безусловно полезное влияние оказали сотрудники ИСА РАН Н.Е.Бузикашвили, А.Я.Подрабинович, А.В.Усков, В.В.Фарсобина.

Я выражаю глубокую благодарность своим учителям, коллегам и друзьям, способствовавшим появлению этой книги.

Я очень признательна Российскому фонду фундаментальных исследований, поддержавшему как издание книги (проект --07--07006-д), так и работы, определившие значительную часть содержания (проект --07--0700374-а).


 Об авторе

Надежда Владимировна ПЕСТРЯКОВА

Кандидат физико-математических наук, старший научный сотрудник Института системного анализа РАН. Окончила Московский физико-технический институт.

Область научных интересов -- математическая физика, численные методы, машинное обучение, распознавание образов. Автор более 40 научных работ.

 
© URSS 2016.

Информация о Продавце