19:29 10 Янв 2021

В США создали искусственный интеллект "Дали", который умеет "рисовать" текст

Фото: OpenAI

Американская лаборатория исследований искусственного интеллекта OpenAI, соучредителем которой является Илон Маск, разработала нейронную сеть DALL · E, умеющую генерировать картинки по тексту.

Рисунки искусственного интеллекта опубликовали на сайте компании.

Разработчики отметили, что часто изображения получаются сюрреалистическими, поэтому сеть решили назвать в честь известного сюрреалиста, художника Сальвадора Дали, и персонажа анимационной студии Pixar, WALL·E.

Вот как искусственный интеллект изобразил кресло в форме авокадо.

Фото: OpenAI

А вот варианты химеры жирафа и черепахи.

Фото: OpenAI

Такие варианты нейронная сеть предложила на запрос «улитка, сделанная из арфы».

Фото: OpenAI

Чтобы протестировать возможности DALL · E ученые пытались изобразить от простых бытовых вещей до различных форм, текстур, цифр и позиций. Удалось создать даже конкретные комплекты одежды на манекене и дизайн комнаты.

Вот как искусственный интеллект изобразил редьку дайкон в балетной пачке, выгуливающую собаку.

Фото: OpenAI

Разработчики отмечают, что чем сложнее задачу получает искусственный интеллект, тем большая вероятность погрешности и генерация нечеткой, непонятной картинки. Проблемы также могут возникнуть, если у одного объекта есть несколько слов для описания или наоборот, когда слово имеет много значений.

В целом же успех зависит от того, как четко и лаконично будет сформирован запрос.

Для генерации изображений искусственный интеллект использует набор данных из 12 миллиардов изображений и подписей к ним. Так, нейронная сеть умеет выявлять закономерности и распознавать взаимосвязь между огромными объемами данных.

Благодаря этому ИИ может генерировать изображения человекоподобных животных и предметов, сочетать несколько несвязанных понятий или преобразовывать уже существующие фото.

Эта технология не является новой: DALL · E стал преемником предыдущего генератора текста от OpenAI под названием GPT-3, а сама система генерирования «текста в картинку» существует уже давно. Однако способности нового искусственного интеллекта значительно шире.

Например, он может генерировать изображения конкретной географической точки, а также смог пройти визуальный IQ-тест Рейвена.

Немного критики

Исследователь в области ИИ, профессор Технологического института Джорджии Марк Ридл заявил, что сеть может «воровать» картинки просто из интернета. В качестве примера он отметил, что DALL · E выдал похожие картинки на запрос «пингвин-буррито» с теми, которые можно найти в Google.

penguin-burrito pic.twitter.com/Z3iZ69WjrS
— Mark O. Riedl (@mark_riedl) January 5, 2021

«Мое впечатление: это такая же нейронная сеть по генерации изображения из текста, как и многие другие, которые я видел за последние годы. Но с большим масштабом (с точки зрения параметров и учебных данных) гораздо сложнее найти комбинацию запросов, которая вытолкнет нейронную сеть из ее "зоны комфорта"», ㅡ написал он в Twitter.

Автор: