Первая в мире система категоризации типовых электронных изображений

Ученые европейского научно-исследовательского центра компании Xerox разработали новую эффективную систему, которая может распознавать цифровые изображения типовых объектов и относить их к определенным категориям. Новая система повысит эффективность управления сохраненными электронными изображениями, а также значительно расширит возможности поиска в Интернете, осуществляемого в настоящее время только на основе текста.

Ученые Xerox разработали систему идентификации изображений широкого спектра, позволяющую отнести типовые изображения, такие, например, как изображения людей, зданий, животных, самолетов и книг к определенным категориям. Это первая подобная система, характеризующаяся высокой надежностью, быстродействием и простотой использования.

Эта технология является результатом фундаментальных исследований и многолетней научной работы в области обработки изображений, компьютерном распознавании образов и обучении компьютеров. Категоризация изображений аналогична текстовой категоризации, в которой используется контекстная идентификация по ключевым словам. По технологии Xerox категоризация объекта проводится по его ключевым признакам, так называемым “пэтчам” (patch). Она предусматривает обучение компьютера распознаванию пэтчей, и затем классификации их по группам. То есть новая система относит распознанное изображение к определенной категории или категориям.

По словам Данса, ученым пришлось столкнуться с некоторыми проблемами. Системы более ранних версий могли перепутать изображения с набором одинаковых пэтчей, например, изображения комплекта шин и автомобиля. В современной версии программы эта проблема решена - система анализирует ключевые пэтчи и сопоставляет их другими областями изображения. В этом случае, программа не перепутает комплект шин с автомобилем, так как будут идентифицированы другие ключевые пэтчи автомобиля, например, фары и окна.

По словам г-на Данса, помимо разработки данного программного обеспечения для различных приложений, Xerox продолжит работу над расширением возможностей категоризации системы с тем, чтобы она могла обрабатывать больше визуальных категорий и работала более надежно в сложных случаях, когда интересующий объект составляет лишь небольшую часть области наблюдения.

©1997-2025 Компьютерная газета