kvisaz (kvisaz) wrote,
kvisaz
kvisaz

Category:

Кресло в форме авокадо

У нас с друзьями есть традиция - каждый год на новогодних каникулах смотреть новинки нейронных сетей. Шутка о том, что предыдущий мой всплеск публикаций был как раз год назад - я даже купил пару книжек про нейронки и прочитал их, как смог. Это не обязательно - покупать книжки. Вообще можно ничего не делать, а раз в год проверять очередные новинки.

Ну вот, мне сбросили ссылку на проект DALL·E - нейронка, которая создаёт картинки по текстовому описанию. К сожалению, онлайн-демо нет. Значит, будем ждать сколько - год, полгода, десять лет? Предыдущий текстовый мегагенератор GPT-3 так и не выпустили как продукт для масс (а известный Порфирьевич по слухам и радом с ним не стоял по силе и связности креатива).

Что нам рассказывают про DALL-E? Что можно написать фразу - "an illustration of a baby daikon radish in tutu walking a dog". - и нейронка сгенерирует кучу таких картинок:



Там на странице - https://openai.com/blog/dall-e/ - есть примеры с другими предметами, но они выбираются из списка, свободный ввод текста я не нашел. Так что как проверить? Пока никак, можно только поаплодировать и поверить на слово.

Но в сумме с другими известными работами - проект выглядит правдоподобно. Проекты разных мастей по подбору слов к картинкам и наоборот существуют давно. Генераторы несуществующих картинок - тоже.

Как сделан DALL-E? Это нейронка, которую много-много раз прогнали на парах "описание + картинка". "DALL·E is a simple decoder-only transformer that receives both the text and the image as a single stream of 1280 tokens—256 for the text and 1024 for the image—and models all of them autoregressively."

Дополнительные примеры
"a professional high quality illustration of a giraffe turtle chimera...."


"An armchair in the shape of an avocado. An armchair imitating an avocado".



Ещё












PS: смотрите, есть два типа далеких от инженерии (в общем смысле - от описываемой области) людей. Первые радуются как дети - "завтра будем на Марсе яблоки кушать". Вторые бурчат как старики - "не оторвемся от плоской земли ни мы, ни наши внуки".

Трезвый инженерный подход подразумевает очень большие сроки на доводку до ума, до тех самых яблок, которые смогут сорвать не только подготовленные специалисты. Но уже в ближайшие годы проекты, как правило, начинают оказывать влияние на все смежные области, расползаясь по целому дереву наук и профессий.

PPS: я смотрю, детские иллюстрации уже хоть сейчас в печать. Но надо понимать, что это скорее всего отобранные из лучших.
Tags: нейронки
Subscribe

Posts from This Journal “нейронки” Tag

  • Легальный дипфейк

    Дипфейк - технология реалистичной подмены изображения в видео. Угадайте, как легально его применяют в политике? И как будут применять в рекламе?…

  • Писательский компьютер болгарского фантаста

    Вспомнил, что читал очень давно "Упущенный шанс" от болгарского фантаста по имени Любен Дилов. Это сборник рассказов, якобы написанных компьютером.…

  • Как обмануть Фрэнка

    Нужно написать краткий пост с исключительно нужными тематическими словами. Булочки, марципан, изюм, вкусные рецепты выпечки, кулинарные изделия.…

  • Post a new comment

    Error

    default userpic
    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 5 comments