Новая система искусственного интеллекта способна нарисовать объекты, пользуясь лишь их подробным текстовым описанием | Мир игр

Мы в свое время рассказывали о том, что специалисты компании Google научили свою систему искусственного интеллекта рисовать, в результате чего на свет появились картины, словно сошедшие из-под кисти какого-нибудь художника-абстракциониста. Однако, если перед системой компании Google поставить задачу «нарисовать желтую птицу с черными крыльями и коротким клювом», она, скорее всего, не сможет успешно справиться с ее выполнением. Тем не менее, такая задача вполне по силам новой системе, созданной специалистами компании Microsoft, и чем подробней будет текстовое описание объекта, том более точный рисунок сможет нарисовать эта система.

Отметим, что новая система не использует никаких готовых рисунков, она создает изображение абсолютно с нуля. «Если вы ищете птицу, то Bing или другая поисковая система выдаст вам множество изображений птиц. Но в нашем случае компьютер создает изображения с чистого листа, рисуя их пиксель за пикселем» — рассказывает Ксиадонг Хи (Xiaodong He), ведущий исследователь, — «Нарисованные птицы, возможно, не существуют в реальном мире, они являются лишь отражением воображения нашего компьютера».

Основой новой системы являются технологии компьютерного видения SeeingAI и технология обработки естественного языка CaptionBot. Такой набор технологий уже используется для составления заголовков для снимков, для ответов на вопросы, задаваемых людьми касательно конкретных фотографий и т.п. Обе вышеупомянутые технологии реализованы в виде нейронной сети Generative Adversarial Network (GAN) и конкурирующей нейронной сети, которая «критикует» создаваемые изображения. Изначально эта система была обучена на парах изображений и заголовков, которые помогли создать базу данных, связывающих элементы изображений с элементами текстового описания.

В настоящее время работу новой системы искусственного интеллекта компании Microsoft еще нельзя считать идеальной. Но перспективы использования таких систем в будущем весьма обширны. Такие системы смогут стать помощниками художникам и дизайнерам, при их помощи можно будет работать над фотографиями, используя голосовое управление. А «венцом» использования такой технологии могут стать мультипликационные фильмы, составленные компьютерами на основе письменных художественных произведений.

Источник: dailytechinfo.org