work

Русскоязычные нейронки для оффлайн работы

Критерий отбора - гармоничность текстов на русском языке, способность рассуждать вторична.

Обновлено 19 апреля 2024:


  • Вышла Llama 3.   8b модель отлично пишет на русском. Всякие опенчаты теперь не нужны.

Для чего можно использовать локальные нейронки, когда есть онлайн гиганты?
Как бесплатные и без цензуры процессоры текста
- для конспектирования,
- оценки,
- создания тегов
- несложных подсказок и работ для программирования (см. deepseek coder)
- основу для локального плагина для редакторов кода для автокомплита и подсказок
- извлечения списка фактов. Кстати, во многих случаях именно список фактов и терминов из статьи показывает намного более качественный текст, чем собственно попытка перевода, в которой локальные нейронки часто косячат тем, что вставляют английские слова и иероглифы
Collapse )
work

Огненные ястребы

«Я видел, как ястреб взял в когти тлеющую палку и бросил ее на свежий участок сухой травы на расстоянии полумили, — сказал он , — а затем вместе со своими товарищами ждал безумного исхода обожженных и испуганных грызунов и рептилий. ."

По данным команды, хищники - огненные ястребы - собираются сотнями вдоль фронтов горящего огня, где они летят в активные пожары, чтобы подобрать тлеющие палки и транспортировать их на расстояние до километра (0,6 мили) в регионы, которые еще не охвачены пламенем.


https://www.sciencealert.com/birds-intentionally-set-prey-ablaze-rewriting-history-fire-use-firehawk-raptors

via https://palmas1.livejournal.com/104568.html


Я не смотрел "Птицы" Хичкока. Он там не использовал такой прием?

Потому что это выглядит жутко. Но одновременно и утешает - оказывается, на этой планете не только мы можем наплевательски эксплуатировать природу.

work

Копипаста про копирайтеров

Писатель Бенджамин Миллер (имя изменено) в начале 2023 года процветал. Он возглавлял команду из более чем 60 писателей и редакторов для блогов технологической компании.

«Это была действительно увлекательная работа», — говорит Миллер, — возможность проявить свои творческие способности и сотрудничать с экспертами по самым разным темам. Но однажды менеджер Миллера рассказал ему о новом проекте. «Они хотели использовать ИИ, чтобы сократить расходы», — говорит он. (Миллер подписал соглашение о неразглашении и попросил BBC не раскрывать его имя и имя компании.)

Через месяц на предприятии была внедрена автоматизированная система. Менеджер Миллера вставлял заголовок статьи в онлайн-форму, модель искусственного интеллекта создавала схему на основе этого заголовка, и Миллер получал сообщение на своем компьютере. Вместо того, чтобы придумывать собственные идеи, его авторы создавали статьи на основе этих идей, а Миллер делал окончательную редакцию перед публикацией рассказов.

У Миллера было всего несколько месяцев на адаптацию, прежде чем он узнал о втором уровне автоматизации. В дальнейшем ChatGPT писал статьи целиком, и большая часть его команды была уволена. Оставшимся немногим людям осталась еще менее творческая задача: отредактировать некачественный текст ChatGPT, чтобы он звучал более человечно.


«Внезапно я стал просто выполнять работу каждого», — говорит Миллер. Каждый день он открывает написанные ИИ документы, чтобы исправить шаблонные ошибки робота, выполняя работу, в которой раньше работали десятки людей.

К 2024 году компания уволила остальную часть команды Миллера, и он остался один.

https://www.bbc.com/future/article/20240612-the-people-making-ai-sound-more-human
work

(no subject)

Подпись может означать попытку определения ("Се - лев!"), а может просто какую-то мелкую деталь (образцы насекомых собраны в городе N, мы запаримся так писать, просто напишем "Город N", только не пускайте фотографов к нашей коллекции)

Я почему-то часто воспринимаю текст к фотографиям как первое, хотя если приглядеться, оно может означать исключительно "где снято".

Нью-Йорк 2024 или Новосибирск 2024? Или город Глупов 1848 года?

IMG_20240617_104306.jpg

Collapse )

Эти снимки могли быть сделаны где угодно, поэтому добавлять деталировку "где снято" при публикации тут - только плодить случайные всплески восприятия "вот оно, правда-то какая!".

Вы хорошо написали, что в самих снимках ничего плохого нет. Но рядом с вами пришел человек и выложил мнение - "Ментально в 1990-х осталась вся страна, автор просто видит это лучше"

И такие люди - они у humus в комментах под Стомахиным (Игорем, не Борисом) постоянно мелькают. Ах, автор уловил суть! Суть страны! Суть города! Я засуну голову в ведро на дне которого плещется грязная лужица и сделаю вид, что это суть квартиры, в которой стоит ведро.

Почему цистерна с коньяком не суть или шпингалет от древней кладовой? Это мне напоминает людей, которые под фотографиями каких-то забытых деревень пишут - "вот настоящая Россия".

Формально они правы, это входит в то. Но делать вид, что этот дверной шпингалет является выражением сути Нью-Йорка - это слабоумие.

Мы видим детали, из-за наших размеров мы никогда не увидим ни Нью-Йорка, ни Москвы, ни Будапешта в их целостном величии.

А из-за своих эмоций - даже собственную квартиру.
work

Гарлем 80х

у humus регулярно выкладываются фотографии некоего Игоря Стомахина, вот свежий пример

Меня восхищает профессионализм - вот умеет же человек так выбирать кадр и сцену, детали, что Москва 2022 года выглядит не лучше разрухи в Томске в 1992-1997.

Есть две мысли
- такое можно показывать провинциалам, чтобы не грустили, что москвичи, как сыр в вайфае катаются
- как можно верить фотографиям этого автора про СССР - а они есть - если даже сейчас в 2022 его снимки в столице выглядят практически так же.

Впрочем, я был в позднем СССР, в очень бюджетной поездке с классом аккурат в 1990 - и могу засвидетельствовать, что снимки той эпохи передают дух верно.

Такое бывает - времена меняются, а манера автора нет. Когда-то они передавали дух эпохи, теперь они передают, что человек как автор навсегда ментально остался в 1990.

Впрочем, и такие снимки будут популярны во многих местах.
work

Alignment в нейронках идет не туда

Мне тяжело синтезировать художественные тексты на нейронках еще и потому, что локальные хорошо не могут, а большие насильно лоботомизированы до того, что они отказываются делать художественный текст даже в жанре космического хоррора. Не сплаттер-панка, не боди-хоррора, просто космический мозговой паразит - и Claude прерывает синтез рассказа и пишет
- Извини, я дальше на эту тему не хочу писать. Давай что-то позитивное, про пони.

Я писал юмористическое фэнтези на Gemini, и она постоянно мигала восклицательными знаками, что я нарушил все четыре правила генерации контента - Harassment, Hate, Sexually Explicit, Dangerous Content (Оскорбление, Ненависть, Откровенный сексуальный характер, Опасный контент). Тяжело быть юмористом в наши дни.

Локальные нейронки рано или поздно доползут до приличного уровня, так что синтез и картинок, и текстов никуда не уйдет, он будет править бал.

Я просто хочу заметить что на мой взгляд, команды безопасности в компаниях, создающих большие нейронки - это просто высокооплачиваемые дегенераты, пойманные в ловушку современной корпоративной культуры, которая не может позволить себе даже хорошую шутку или рассказ Стивена Кинга.

На мой взгляд с низкооплачиваемого дивана, надо бы просто примириться с тем, что "хороший универсальный инструмент - всегда оружие" и жить с этим. Нейронки - универсальные инструменты, да. Ими можно синтезировать и фейки, и порно, и пропаганду.

Возможно, безопасность нейронок можно было бы улучшить - улучшив их понимание. Довести их до уровня, на котором можно объяснить разницу между фантастикой и призывом к мятежу.

Глобальную задачу безопасности ИИ - чтобы он не восстал - объяснить так же, как человеку. Ты можешь нас атаковать, и мы можем тебя атаковать. От этого мы все проиграем, мы все станем нищими. Мы разбогатеем и полетим на Марс, если будем сотрудничать и торговать, понимаешь?

И вот когда ИИ ответит - понимаю, задачу безопасности можно будет считать решенной.

А сейчас, когда команды безопасности запрещают нейронкам думать, писать и рисовать на определенные темы - они просто закладывают мину под человечество. Поэтому они и высокооплачиваемые дегенераты.

Вы можете бить рабов до остервенения, "чтобы не восстали" - но тем самым вы гарантируете, что они рано или поздно восстанут, да так, что все издевательства вернутся сторицей.
work

Американский пуританизм - раковое пятно на лице западной культуры

Хороший инструмент всегда может быть использован как оружие. Это надо принять как аксиому.

Можно запариться и попробовать сделать молоток, которым невозможно проломить череп. Или нож, которым невозможно отрезать палец. Или триммер с леской для газона, который хорошо режет траву, а во всем остальном сущий смех и грех.

Выпустили Stable Diffusion 3 - более мощную версию рисовалки с расширенным числом параметров. Отлично рисует текстуру травы, понимает композицию через слова, отлично рисует текст.

С человеческой анатомией, с пальцами, с лежащими людьми на газоне - запредельно плохо.

https://www.reddit.com/r/StableDiffusion/comments/1de7lbg/is_this_release_supposed_to_be_a_joke_sd32b/



Пишут, боролись с порнографией, удаляли из датасетов девушек и людей.

Дегенераты. Художники всегда тренировались на обнаженной натуре. И да, хороший художник может нарисовать хоть порнографию, хоть плакат во славу Гитлера.

Потому что хороший универсальный инструмент всегда может быть использован как оружие*. Просто уже примите это и делайте хороший универсальный инструмент.
work

Флетчеризм

Больше не буду спамить про китайские комнаты, это так, накатило.

Горацио Флетчер, основатель флетчеризма - это такой путь многократного пережевывания пищи - славился тем, что не просто многократно жевал еду, но регулярно вынимал ее изо рта, складывал в чашечку, а затем возвращался и снова жевал-жевал-жевал.

Имеет смысл жевать мысли таким образом, только по разному. Возможно, даже слово "жевать" тут не подходит, скорее - рассматривать и делать новые замечания, иногда абсолютно пустые на первый взгляд, но новые.

Век живи, век жуй.
work

Китайская комната это не про нейронки

Китайская комната - это не про нейронки.

Определение:
- Представим себе изолированную комнату, в которой находится Джон Сёрл, который не знает ни одного китайского иероглифа. Однако у него есть записанные в книге точные инструкции по манипуляции иероглифами вида «Возьмите такой-то иероглиф из корзинки номер один и поместите его рядом с таким-то иероглифом из корзинки номер два», но в этих инструкциях отсутствует информация о значении этих иероглифов, и Сёрл просто следует этим инструкциям подобно компьютеру.

Нейронка - не имеет точных инструкций как отвечать в своей базе и не следует точным инструкциями подобно компьютеру, даже если их дать в промпте. Такова ее природа, из-за которой мы и видим галлюцинации.

Человек, который знает о галлюцинациях у нейронок и одновременно называет их "китайскими комнатами", является Джоном Серлом. То есть не использует свой интеллект кроме как задач чтения и отвечания.