В США создали искусственный интеллект "Дали", который умеет "рисовать" текст
Американская лаборатория исследований искусственного интеллекта OpenAI, соучредителем которой является Илон Маск, разработала нейронную сеть DALL · E, умеющую генерировать картинки по тексту.
Рисунки искусственного интеллекта опубликовали на сайте компании.
Разработчики отметили, что часто изображения получаются сюрреалистическими, поэтому сеть решили назвать в честь известного сюрреалиста, художника Сальвадора Дали, и персонажа анимационной студии Pixar, WALL·E.
Вот как искусственный интеллект изобразил кресло в форме авокадо.
А вот варианты химеры жирафа и черепахи.
Такие варианты нейронная сеть предложила на запрос «улитка, сделанная из арфы».
Чтобы протестировать возможности DALL · E ученые пытались изобразить от простых бытовых вещей до различных форм, текстур, цифр и позиций. Удалось создать даже конкретные комплекты одежды на манекене и дизайн комнаты.
Вот как искусственный интеллект изобразил редьку дайкон в балетной пачке, выгуливающую собаку.
Разработчики отмечают, что чем сложнее задачу получает искусственный интеллект, тем большая вероятность погрешности и генерация нечеткой, непонятной картинки. Проблемы также могут возникнуть, если у одного объекта есть несколько слов для описания или наоборот, когда слово имеет много значений.
В целом же успех зависит от того, как четко и лаконично будет сформирован запрос.
Для генерации изображений искусственный интеллект использует набор данных из 12 миллиардов изображений и подписей к ним. Так, нейронная сеть умеет выявлять закономерности и распознавать взаимосвязь между огромными объемами данных.
Благодаря этому ИИ может генерировать изображения человекоподобных животных и предметов, сочетать несколько несвязанных понятий или преобразовывать уже существующие фото.
Эта технология не является новой: DALL · E стал преемником предыдущего генератора текста от OpenAI под названием GPT-3, а сама система генерирования «текста в картинку» существует уже давно. Однако способности нового искусственного интеллекта значительно шире.
Например, он может генерировать изображения конкретной географической точки, а также смог пройти визуальный IQ-тест Рейвена.
Немного критики
Исследователь в области ИИ, профессор Технологического института Джорджии Марк Ридл заявил, что сеть может «воровать» картинки просто из интернета. В качестве примера он отметил, что DALL · E выдал похожие картинки на запрос «пингвин-буррито» с теми, которые можно найти в Google.
penguin-burrito pic.twitter.com/Z3iZ69WjrS
— Mark O. Riedl (@mark_riedl) January 5, 2021
«Мое впечатление: это такая же нейронная сеть по генерации изображения из текста, как и многие другие, которые я видел за последние годы. Но с большим масштабом (с точки зрения параметров и учебных данных) гораздо сложнее найти комбинацию запросов, которая вытолкнет нейронную сеть из ее "зоны комфорта"», ㅡ написал он в Twitter.