AI Google научился создавать 3D-сцены из изображений

В 2014 году британский стартап DeepMind был куплен компанией Google. И это тот случай, когда покупку можно назвать успешной. Сегодня DeepMind демонстрирует прорывные технологии в области искусственного интеллекта, и одной из таких является фреймворк Generative Query Network (GQN), о котором сегодня и пойдет речь.

Как правило, для нейросетей, основанных на работе с изображениями, используется база с огромным множеством картинок. Чтобы искусственный интеллект в дальнейшем мог определять объекты на фотографиях, необходимо на картинках из базы вручную отмечать объекты, например, диван, пол, кресло и так далее. Этот процесс довольно трудоемкий и требует много времени.

Поэтому разработчики Google придумали новый, более технологичный метод. Суть его заключается в том, что искусственный интеллект будет сам определять объекты, дополнять сцены, понимать, какие действия происходят в кадре, учитывать освещение, материалы различных объектов. Теперь для создания 3D-сцен из 2D-изображений нужно будет лишь показать искусственному интеллекту изображения сцены, и всё будет готово.

Ниже видно, как ИИ на основе одного изображения строит целую сцену:

Пока проект находится на раннем этапе разработки, и говорить о сложных сценах не приходится. Но даже сейчас результат потрясающий.

Мнением делитесь в Telegram-чате или ниже в комментариях.

По материалам deepmind