Не можете отличить Тань Чжо от Хао Лея? Сделайте по 200 фотографий и позвольте глубокому обучению помочь нам идентифицировать их.
проблема
"Как распознавать изображения с помощью Python и глубоких нейронных сетей?В статье я показал вам, как с помощью глубокого обучения научить компьютер различать робота Валл-И и Дораэмона.
Вскоре пользователь оставил сообщение в фоновом режиме, спрашивая:
Учитель, я хочу обучить классификатор изображений самостоятельно. Где я могу загрузить помеченные обучающие изображения в пакетах?
Расскажите, как я нашел картинки, когда писал туториал.
Самая большая фототека, конечно, у Google.
В разделе Google Images введите «Walle».
Как насчет этого? Результаты поиска очень подходят.
Вы не только нашли партию высококачественных изображений, но и пометили их Google.
Следующим шагом, конечно же, будет размещение этих картинокскачатьвниз.
Я позволяю учащимся сделать это практически, каждый находит два разных набора изображений, отличающихся от других, и пытается выполнить классификацию глубокого обучения в соответствии с учебным пособием.
Решения, которые я им предложил (несколько разных плагинов для браузера Chrome), не сработали.
Некоторые из них переставали работать после загрузки всего нескольких картинок и даже приводили к краху браузера.
Некоторые загруженные изображения дублируются.
Студенты сказали мне, что самый простой и эффективный проверенный метод — это вручную нажимать и загружать один за другим...
Это явно не правильный путь.
Болевые точки
Стремление получить высококачественные аннотированные изображения в пакетном режиме из библиотеки изображений Google не будет иметь места.
Неужели никто не пытается решить эту общественную проблему?
Сегодня случайно наткнулся на замечательный проект на Github под названиемgoogle-images-download
.
Репозиторий Github связан по адресуздесь.
Прошло всего 5 месяцев с момента выхода проекта, а количество звезд достигло 2000, что кажется действительно очень популярным.
google-images-download
является скриптом Python.
Используя его, вы можете выполнить поиск изображений Google и функции пакетной загрузки с помощью одной команды.
Более того, инструмент также работает кроссплатформенно, поддерживая Linux, Windows и macOS.
Просто ленивое Евангелие.
Установить
google-images-download
Установка проста.
Возьмите macOS в качестве примера, просто запустите следующую команду в терминале:
pip install google_images_download
Установка завершена.
Конечно, для этого в вашей системе должна быть установлена среда Python.
Если вы еще не установили его или не знакомы с командами работы терминала, вы можете обратиться к моему "Как установить среду выполнения Python Anaconda? (видеоурок)", узнайте, как загрузить и установить Anaconda, а также выполнять операции командной строки терминала.
пытаться
Войдите в каталог загрузки:
cd ~/Downloads
Попробуем загрузить несколько картинок.
В «Я не бог медицины» есть актриса по имени Тань Чжо, и она хорошо справляется со своей задачей. Но сначала я думал о ней как о Хао Лэй.
Давайте попробуем загрузить несколько фотографий Тань Чжо.
Выполнить в терминале:
googleimagesdownload -k "谭卓" -l 20
поясни, вот-k
Относится к «ключевому слову», которое является «ключевым словом», за которым следует ключевое слово для поиска в двойных кавычках.
Как видите, использовать китайские ключевые слова не проблема.
Назад-l
, относится к «лимиту», то есть количество изображений ограничено, вам нужно указать, сколько изображений вы хотите загрузить.
В этом примере нам нужно 20.
Далее идет процесс выполнения:
Законченный.
Как видите, в процессе загрузки произошла ошибка.
Но программа все же выстояла и помогла нам довести процесс загрузки до конца.
Давайте посмотрим на результаты.
Загруженные изображения сохраняются в~/Downloads/downloads/谭卓
под,google-images-download
Очень интимно, создайте для нас подкаталоги.
Откроем его в Finder и увидим:
После долгого просмотра некоторые фотографии до сих пор не ясны для Хао Лэя.
Чтобы полностью отличить двух актрис, давайте загрузим еще 200 фотографий Хао Лэй.
Следуя команде только что, мы выполняем:
googleimagesdownload -k "郝蕾" -l 200
Затем... он сообщил об ошибке:
решать
Если у вас есть проблема, не паникуйте.
Вы должны внимательно посмотреть на сообщение об ошибке.
Обратите внимание на наличие ключевого слова:chromedriver
.
Что это?
мы возвращаемсяgoogle-images-download
изгитхаб-страница,отchromedriver
Поиск ключевых слов.
Вы сразу же найдете такие результаты:
Получается, что если количество нужных картинок превышает 100, программа должна вызывать Selenium и chromedriver.
Selenium установлен в вашемgoogle-images-download
когда он устанавливается автоматически.
Вам просто нужно скачать chromedriver и указать путь.
ссылка для скачивания наздесь.
Пожалуйста, выберите подходящую версию в соответствии с типом вашей операционной системы:
Я выбрал версию для macOS.
После скачивания в сжатом пакете только один файл.Разархивируйте его и поместите в~/Downloads
Под содержанием.
Затем выполните:
googleimagesdownload -k "郝蕾" -l 200 --chromedriver="./chromedriver"
здесь--chromedriver
параметры, чтобы сказатьgoogle-images-download
, после декомпрессииchromedriver
дорожка.
На этот раз машина усердно работала и помогла нам загрузить фотографии Хао Лея.
200 фотографий, загрузка занимает некоторое время. Пожалуйста подождите.
Это конец.
Также есть некоторые ошибки в середине, и некоторые изображения загружаются неправильно.
К счастью, это не сильно повлияло на общий результат.
Чтобы быть в безопасности, рекомендуется установить больше при настройке количества загрузок.
Обеспечьте себе запас прочности.
Откроем скачанный каталог~/Downloads/downloads/郝蕾
Взгляни:
Сможете ли вы отличить их друг от друга на этот раз?
Операция
Я оставляю вам домашнее задание.
Вы научились загружать фотографии Тань Чжо и Хао Лея одной командой.
Можете ли вы научиться использовать то, что мы представили раньше?Знание сверточной нейронной сети,использоватьTuriCreate(или Tensorflow), построить модель для распознавания фотографий двух людей?
После выполнения задания сообщите, пожалуйста, результаты теста на точность.
Конечно, было бы еще лучше, если бы вы могли использовать сценарий, который мы представили сегодня, загружать другие коллекции изображений и проводить обучение глубокому обучению.
Вы также можете оставить мне отзыв о результатах.
Лайк пожалуйста лайк. Вы также можете подписаться на мой публичный аккаунт в WeChat и закрепить его."Юшу Чжилань" (нкваншуйи).
Если вы интересуетесь наукой о данных, вы можете прочитать мою серию постов с учебными указателями "Как эффективно начать работу с наукой о данных?", есть более интересные задачи и решения.