«Компьютерное воображение» научилось создавать картинку по ее описанию

Гаджеты

1-3 Декабря 2009 г состоится научно-практическая конференция, посвященная развитию отечественной наноиндустрии.
1–3 декабря 2009 г. в г...
10 Безумных гаджетов для отправки сообщений
Стилус-насадка для носа — гаджет для тех, кто постоянно мечтал иметь лишний палец на лице...
10 Безумных периферийных устройств для компьютера
Titan Sphere — продукт скоро разорившейся компании SGRL, неудавшаяся попытка сообщить новое слово в сфере джойстиков...
10 Безумных японских изобретений
Раструбы для глазных капель разрешают совершенно верно прицелиться в глаз, в то время, когда необходимо его чем-то зака...
10 Бесполезных органов человека
Существуют ли в действительности ненужные органы? Вряд ли кому-то захочется расстаться со своим аппендиксом , пока он е...
10 Важнейших стадий развития персональных компьютеров
«Мать всех демонов», 1968 год...
10 Вариантов будущего через тысячу лет
Будущее с инопланетянами — почему бы и нет? Кое-какие уверены, что инопланетяне уже среди нас...

Немного интересного:

Афк «система» произведет метки для крупного рогатого скота россии
Минсельхоз приступает к общероссийскому очипированию крупного скота(КРС) совместно с АФК «Совокупность», — об этом заяви...
Дозорный морских глубин
С созданием первых боевых подводных лодок человечество взяло в руки оружие громадной разрушительной силы...
Коллайдер из клеточного автомата производит вычисления
Как продемонстрировали изучения, виртуальный ускоритель, в котором вместо настоящих частиц сталкиваются конфигурации кле...
Концепт-кар volkswagen xl1 появится на улицах германии
26 января на интернациональном автосалоне Qatar Motor Show 2011 германская компания представила собственный третий гибри...
Гоночные электромобили будут подразяжаться без проводов
Как мы все знаем, автогонки редко устраиваются людьми без широких денежных возможностей...

«Компьютерное воображение» научилось создавать картинку по ее описанию 30.07.2012 Hi-tech

Исследователи из Токийского университета создали метод для восстановления изображения по его «кусочному» описанию. Такая задача подобна сборке картины-пазла: известны типы «кусочков» и их правильное количество, нужно вернуть исходную картину. По словам авторов, эта работа есть ответственным шагом для области «компьютерного воображения», с его помощью планируется создавать изображения лишь на базе их текстового описания.

Препринт с описанием изучения выложен на сайте arXiv.org.

Сверху вниз: исходное изображение, пара примеров воссозданных картин и итог поиска в базе по картинкеИзображение: Hiroharu Kato et al./ arXiv.org

Созданная авторами программа основана на представлении изображения в виде «мешка визуальных слов» (Bag-of-Visual-Words). Данный способ изначально был создан для анализа текстов, практически, «мешок слов» является наборомпар «слово» — «число его появлений в тексте». При картин все подобно, лишь вместо «слов» употребляются маленькие усредненные фрагменты изображений. «Компьютерное воображение» научилось создавать картинку по ее описанию

Из каждой картины авторы создавали собственный «мешок», а после этого пробовали вернуть из него оригинал, другими словами расставить фрагменты в верном порядке. Для этого ученые применяли два типа параметра «естественности» (naturalness): локальную и глобальную.

Принципиальная схема нового метода. Изображение: Hiroharu Kato et al./ arXiv.org

Размещение считалось локально «естественным», в случае если изображения на кусочках медлено переходили приятель в приятеля, не было явных нестыковок. Глобальная естественность оценивалась по базе данных известных изображений. Она определяла, к примеру, что фрагменты неба должны размешаться в верхней части картины, а лицо человека на портрете — ближе к центру.

Авторы использовали собственный метод для восстановления изображений различных жанров. Они оценивали степень схожести взятых «реконструкций», и определяли, какое оптимальное соотношение должно быть между глобальной и локальной естественностью, поскольку обычно эти параметры «в чистом виде» давали совсем различные результаты.

Оказалось, что среди подобных программ новый метод выдавал отличных показателей по степени схожести с оригиналом. На многих картинах легко возможно предугадать изображенный объект, кроме того не имея под рукой описания либо исходного изображения.

Попытки создания изображений по текстовому запросу. Изображение: Hiroharu Kato et al./ arXiv.org

В качестве опыта ученые кроме этого постарались создать изображения «с нуля», основываясь лишь на текстовом описании. По словам авторов, хоть им и удалось взять изображения, отдаленно напоминающие описание, задание выяснилось через чур тяжёлым для их метода.

Неприятность складывания пазла прекрасно известна в математике, но в первый раз ученые применили ее для воссоздания картины по ее описанию. Кроме области компьютерного воображения авторы собираются использовать метод для оптимизации программ, распознающих изображения. Для их работы необходимо классифицировать картины по комплекту показателей, но не всегда удается установить, какие конкретно показатели оптимально подходят для данной задачи.

Реконструкция изображения по заданным показателям и сравнение результата с оригиналом разрешит осознать, какие конкретно показатели были значимы, а какие конкретно — нет.

Интересные темы:

Гаджеты

Немного интересного:

«Компьютерное воображение» научилось создавать картинку по ее описанию

Случайные записи:

как создать картинку для рекрутинга со своим фото

Похожие статьи, которые вам понравятся: