В США создали искусственный интеллект "Дали", который умеет "рисовать" текст

Фото: OpenAI
Американская лаборатория исследований искусственного интеллекта OpenAI, соучредителем которой является Илон Маск, разработала нейронную сеть DALL · E, умеющую генерировать картинки по тексту.
Рисунки искусственного интеллекта опубликовали на сайте компании.
Разработчики отметили, что часто изображения получаются сюрреалистическими, поэтому сеть решили назвать в честь известного сюрреалиста, художника Сальвадора Дали, и персонажа анимационной студии Pixar, WALL·E.
Вот как искусственный интеллект изобразил кресло в форме авокадо.

Фото: OpenAI
А вот варианты химеры жирафа и черепахи.

Фото: OpenAI
Такие варианты нейронная сеть предложила на запрос "улитка, сделанная из арфы".

Фото: OpenAI
Чтобы протестировать возможности DALL · E ученые пытались изобразить от простых бытовых вещей до различных форм, текстур, цифр и позиций. Удалось создать даже конкретные комплекты одежды на манекене и дизайн комнаты.
Вот как искусственный интеллект изобразил редьку дайкон в балетной пачке, выгуливающую собаку.

Фото: OpenAI
Разработчики отмечают, что чем сложнее задачу получает искусственный интеллект, тем большая вероятность погрешности и генерация нечеткой, непонятной картинки. Проблемы также могут возникнуть, если у одного объекта есть несколько слов для описания или наоборот, когда слово имеет много значений.
В целом же успех зависит от того, как четко и лаконично будет сформирован запрос.
Для генерации изображений искусственный интеллект использует набор данных из 12 миллиардов изображений и подписей к ним. Так, нейронная сеть умеет выявлять закономерности и распознавать взаимосвязь между огромными объемами данных.
Благодаря этому ИИ может генерировать изображения человекоподобных животных и предметов, сочетать несколько несвязанных понятий или преобразовывать уже существующие фото.
Эта технология не является новой: DALL · E стал преемником предыдущего генератора текста от OpenAI под названием GPT-3, а сама система генерирования "текста в картинку" существует уже давно. Однако способности нового искусственного интеллекта значительно шире.
Например, он может генерировать изображения конкретной географической точки, а также смог пройти визуальный IQ-тест Рейвена.
Немного критики
Исследователь в области ИИ, профессор Технологического института Джорджии Марк Ридл заявил, что сеть может "воровать" картинки просто из интернета. В качестве примера он отметил, что DALL · E выдал похожие картинки на запрос "пингвин-буррито" с теми, которые можно найти в Google.
penguin-burrito pic.twitter.com/Z3iZ69WjrS
— Mark O. Riedl (@mark_riedl) January 5, 2021
"Мое впечатление: это такая же нейронная сеть по генерации изображения из текста, как и многие другие, которые я видел за последние годы. Но с большим масштабом (с точки зрения параметров и учебных данных) гораздо сложнее найти комбинацию запросов, которая вытолкнет нейронную сеть из ее "зоны комфорта"", ㅡ написал он в Twitter.
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.
Добавить комментарий