Capture Text 3.1

главная » статьи » 2006 » 32 » 16.08.2006‣soft

сайт 425 Кб
shareware/trialware, $30

"Коварству авторов предела, братцы, нет":). В справке к Capture Text разработчики называют свое детище "по-настоящему инновационным OCR- продуктом, который позволяет вам выделять текст откуда угодно и копировать его в буфер обмена, опционально сохраняя форматирование". Дальше идут многообещающие заявления о том, что "Capture Text использует базу данных шрифтов для распознавания символов, отображаемых на вашем экране. При помощи этого способа можно распознавать содержание любого окна, вне зависимости от его природы. Кроме того, Capture Text может работать и с графикой". Другими словами, нам обещают этакий FineReader, способный распознавать не только текст из сохраненных изображений, но *вообще весь текст на экране*, будь то кусок окна приложения, открытая картинка или текст из Flash-ролика, занимающего часть места на странице, отображаемой Internet Explorer'ом. Если в вашей системе установлен шрифт, которым сделана надпись, программа его распознает. Теперь обратите внимание: есть ли в приведенном выше фрагменте хелпа хоть одно указание на то, как программа распознает текст, т.е. насколько качественный результат мы будем иметь в конечном счете? Ничего подобного. И это не удивительно, потому что временами софтина работает ужасно странным образом.

Элегантно извлекать текст из текстовых же приложений, обведя искомую область рамочкой — фокус не сильно впечатляющий, хотя, если вы устали от стандартного виндового способа выделения фрагментов8)… Можно использовать Capture Text и для того, чтобы перевести в текст список файлов из открытой Проводником папки или еще что-нибудь в этом роде — и никаких нареканий у вас не возникнет. А вот когда доходит до графических или "продвинутых" текстовых (например, из MS Office) приложений, то здесь начинаются странности. Во-первых, это касается сглаживаемых TrueType- шрифтов. В одной программе они распознаются, а в другой узнаваем только текст, напечатанный шрифтом Courier, MS Sans Serif, Fixedsys и иже с ними. Разница, по-видимости, состоит в том, что первая программа работает-таки с текстом, и на время копирования картинки CaptureText автоматически отключает в ней сглаживание — хотя, скопировав, все равно по загадочным мотивам пытается распознать ее именно как изображение, а не текст. В графических же приложениях, если у вас включено сглаживание, Capture Text начинает путаться из-за смазанных соседних пикселей, выдавая полную белиберду. Чтобы избежать этого, отключите сглаживание (снимите эту галочку: Свойства экрана -> Оформление -> Эффекты -> Применять следующий метод сглаживания экранных шрифтов). Следующая причуда программы состоит в том, что распознаваемый текст должен быть напечатан действительным размером шрифта — то есть, скажем, точно 12-м Times New Roman. Если, например, масштаб окна Word равен 90% (и все буквы выглядят чуть меньше), распознавание происходит, мягко говоря, довольно приблизительное. Наконец, в случае наличия даже сравнительно небольшого количества помех (как если вы распознаете черный текст на немонотонном светло-сером фоне), Capture Text снова просто творит чудеса. Первая программа, обладающая фантазией;). Подводя итог, можно сказать, что эта разработка во многом оригинальна и хороша — но именно как OCR она не стоит почти ничего. Вопрос окупаемости ее цены может решить только конкретный клиент, исходя из конкретных потребностей.
"Средне"

Михаил Федотов, AlsoKnownAs $ky$pe@R, skyspear@tut.by, Минск, 2006

Компьютерная газета. Статья была опубликована в номере 32 за 2006 год в рубрике soft