Второй факт: сравнивать лучше похожее. Так что лица перед сравнением надо бы как-то причесать. Например, чтобы глаза и нос находились всё время на одном и том же месте. Ну и сама картинка всегда была одного размера. В dlib C++ Library есть Real-Time Face Pose Estimation, который позволяет выделять на лице 68 опорных точек (см. картинку). Дальше всё просто: надо повернуть и подогнать размер. Если честно, этот кусок (особенно матрицу для аффинного преобразования) я спёр из OpenFace, но учитывая недавний бум face swap, примеров навалом. Запускаем сбор лиц с камер, имеем тысячи причёсанных лиц. Муторно сортируем их по директориям, получаем начальный training set. Тренируем на нём детектор и видим ЧУДО #Jarvis
Комментариев нет:
Отправить комментарий