Собственно распознавание лиц (не людей, как я понял) - дело 60 строк кода.
Цитата --->
Сегодня - маленький, но важный для меня "первый успех": я смог на локальной машине запустить программку на Питоне, которая без обращений к внешним серверам узнаёт лица в изображении веб-камеры.
Длина программки - 60 строк. [.... пропущено для краткости]
Потрачено времени - 2 часа. Львиная доля времени ушла на выяснение, что для последней версии питона нужной библиотеки пока нет, и установку правильной версии питона))
<--- конец цитаты
Источник - https://piter239.livejournal.com/187715.html
В следующем посте он пишет, что задача отслеживания лиц на видео - это 100 строк. Все работает без обращения к серверу.
У автора есть технический бэкграунд, но значительный вклад в скорость вносит тот факт, что множество вещей сейчас доступны любому желающему - главное продраться через технический лес установки и запуска.
Выглядит трогательно, как посты из настоящего будущего.
Best
piter239
December 30 2019, 20:20:32 UTC 3 years ago
Сделать для общего случая _сегодня_, в конце 2019 года - гораздо быстрее. Берём две готовых нейронных сети, обученных на сотнях тысяч образцов - и получаем инструмент, которому практически всё равно, сколько лиц в наборе.
Разумеется, ложные срабатывания будут - они и у людей бывают.
Меня, как верно заметил уважаемый хозяин этого журнала, впечатлила именно эта сравнительная простота: за несколько дней на бытовой машине приемлемо решается задача, ещё 20 лет назад казавшаяся совершенно фантастической. А дальше, похоже, будет ещё круче.