Метод масок

Для распознавания изображений используют различные методы. Одним из простейших методов является метод масок. Метод масок заключается в сравнении распознаваемого изображения с несколькими специально подобранными изображениями – масками, то есть в отыскании той маски, с которой данное изображение наиболее сходно. Величину, характеризующую сходство, измеряют, проецируя распознаваемое изображение на маску-трафарет, представляющую собой изображение, нанесенное на прозрачный носитель информации, и измеряя суммарный световой поток, прошедший через маску. При этом яркость распознаваемого изображения в каждой точке плоскости маски умножается на коэффициент прозрачности маски в этой точке, и эти произведения суммируются по всей плоскости. Следовательно, суммарный световой поток моделирует функции, характеризирующие яркость изображения и прозрачность маски. Иногда распознаванию предшествует дискретизация изображения.

Метод масок заключается в сравнении распознаваемого изображения с несколькими специально подобранными изображениями – масками

Кроме вышеописанного, метод масок - это также метод распознавания, основанный на вычислении скалярных произведений распознаваемого сигнала с некоторыми фиксированными векторами и на отыскании вектора, который дает наибольшее значение этого произведения. Вычисление скалярных произведений реализуется средствами компьютерной техники. Хотя считается, что метод масок применим лишь для распознавания простых изображений, метод масок достаточно эффективен для распознавания, например, печатных текстов фиксированного шрифта в различных считывающих автоматах.

Например, метод масок можно использовать в задаче обнаружения лиц. Самый популярный на сегодня подход – это детектирование лиц с использованием каскадов Хаара. Каскады Хаара – наборы масок, прямоугольных окошек, каждое из которых представляет собой изображение с неким черно-белым узором. Таких масок может быть неограниченное множество. В этом методе маски накладываются на разные части кадра, и с помощью этого наложения программа определяет, есть ли лицо. Наложение маски на определенную часть кадра дает числовое значение – результат свертки маски с кадром: программа складывает яркость всех пикселей изображения, попавших при наложении в белую часть маски, а также яркость всех пикселей, попавших в черную часть маски, затем вычисляет разность этих значений. Результат свертки сравнивается с пороговой величиной. Популярность данного подхода определяется тем, что свертка вычисляется очень быстро и просто – достаточно выполнить всего три операции для каждого прямоугольного элемента маски.

Инструменты