Компьютерное зрение на питоне неумолимо утыкается в библиотеку OpenCV (Open Source Computer Vision). Которая корнями уходит в Intel и Нижний Новгород, что многое объясняет. В частности то, что установить её непросто. Но всё можно настроить, если достаточно долго крутить в руках (мой вам совет – скачайте wheel, не выпендривайтесь). Так, как тут людей определять? Для этого есть HOG (Histogram of Oriented Gradients) descriptor и getDefaultPeopleDetector(). Который скрывает в себе восторг и радость. Потому, что бот(!) на питоне(!) в шкафу(!) на ноутбуке(!) в реальном времени(!) ОПРЕДЕЛЯЕТ В ВИДЕО ЛЮДЕЙ! АААААаааа!!!111 Будущее наступило! Ыыыыы!!! ВАУ!!!! Ну и так далее. Впрочем, радость немного омрачается там, что будущее пока что наступило немного не туда. При работе с предобученными детекторами очень, очень важно, как и на чём их обучали. Поэтому, если в примере сказано: «Ну, уменьшим картинку до, скажем, 400 пикселей и поставим, например, вот такие параметры», то картинка должна быть ровно 400 пикселей, а изменение параметров приведёт только к росту времени обработки и ухудшению результатов. Но даже с нужными параметрами любимое занятие DefaultPeopleDetector-а – упорно пыриться в куртку, полностью игнорируя кучу людей. Или вот ботинки. В ботинках должен же быть человек! Полотенце скрывает в себе могучий торс. И на стене проступают лики. Короче, количество ложных срабатываний зашкаливает. Впрочем, людей DefaultPeopleDetector тоже иногда признаёт. Теперь у меня игра – заставь Яшу увидеть в тебе человека! #Jarvis
Комментариев нет:
Отправить комментарий