Искусственный интеллект научился описывать человеческим языком то, что он видит

11.06.2014 Hi-tech

Сперва компьютеры обучились распознавать отечественные лица на фотографиях, а сейчас они и вовсе способны достаточно совершенно верно обрисовать то, что делает человек на том либо другом изображении. В прошлом месяце инженеры Гугл показали общественности нейронную сеть Deep Dream, которая может превращать изображения в фантастические абстрактные видения, сейчас же учёные из Стэнфорда представили собственную разработку NeuralTalk, талантливую обрисовывать людской языком то, что она видит.

В первый раз NeuralTalk была упомянута ещё в прошедшем сезоне. Разработкой данной совокупности руководят директор Лаборатории ИИ при Стэнфордском университете Фей-Фей Ли, и его выпускник Андрей Карпатый. ПО, написанное в ходе проекта, способно проанализировать комплексное изображение и определить, что на нём происходит, обрисовав всё замеченное разговорным людской языком.

К примеру, в случае если на фото изображён мужчина в тёмной футболке, играющий на гитаре, то ИИ так и обрисует замеченное: «мужчина в тёмной футболке играется на гитаре».Искусственный интеллект научился описывать человеческим языком то, что он видит Очевидно, работа всё ещё длится, так что метод частенько допускает забавные неточности, но без этого в современной науке никуда. Вы имеете возможность заметить чуть ниже, как выглядит интерфейс тестовой версии метода.

ИИ отыскивает на изображении отдельные объекты, события либо действия и назначает им отдельные слова, в итоге складывая их в осмысленное предложение.

Наряду с этим разными цветами отмечаются объекты, в правильности распознавания которых ИИ не сомневается в той либо другой мере. Вы имеете возможность самостоятельно заметить процесс обучения ИИ на сайте исследователей.

Подобно совокупности Deep Dream от Гугл, NeuralTalk применяет для собственной работы нейронную сеть. Метод сравнивает новое изображение с уже виденными ранее фотографиями, подобно мелкому ребёнку осваивая новые слова и запоминая образы объектов. Учёные раз за разом растолковывают неестественному интеллекту, как выглядит кошка, гамбургер либо ботинок, а NeuralTalk запоминает всё это и фактически точно опознаёт эти образы в будущем.

Разработчикам предстоит непростая и весьма изнурительная работа по обучению голодного до знаний ИИ. Они должны развесить миллионы «бирок с заглавиями» на разные объекты, изображённые на тысячах снимков, перед тем как ИИ обучится самостоятельно обрисовывать демонстрируемые ему ситуации и образы. Для начала учёные сохраняют надежду, что у них окажется создать поисковую машину, которая за мгновение сможет отыскать интересующее вас изображение на бескрайних просторах Интернета.

Возможно в будущем подобная нейронная сеть способна на значительно большее. К примеру, данный метод в полной мере может отыскать не только фотографию, но и интересующий вас момент в фильме, сериале либо ролике с YouTube.

Создатель: Сергей Грэй

Случайные записи:

Дрон с искусственным интеллектом научился обходиться без GPS


Похожие статьи, которые вам понравятся: