Обсуждение законности рептилий

Говорят, что более 50% трафика в Интернете создается поисковыми роботами.Возможно, вы видите, что многие популярные данные создаются поисковыми роботами, поэтому можно сказать, что без поисковых роботов не будет процветания в Интернете.

Однако за внешним благополучием часто скрываются убийственные намерения — в конце 2019 года широко распространилась новость о том, что «программистов привлекли к уголовной ответственности за написание гадов»:

Было арестовано большое количество дата-компаний, десятки из них попали в список следствия.
51 Кредитная карта была проверена, краулер забрал данные и сообщил об этом банку?
Поисковые роботы сканируют или представляют собой нарушение

...

вызванный爬虫合法性Обширное обсуждение, и это также проблема, которую должны понять все энтузиасты и практики краулеров.

Что такое рептилия:

Поисковые роботы按照人为编写规则,自动获取互联网数据скрипт программы. можно понимать как другой你Доступ к сети и запись данных 24/7.

По сути通过编写程序，模拟浏览器上网，让后让其去互联网上抓取数据Инструмент

Область веб-краулера все еще находится на стадии первопроходцев.Хотя мир Интернета установил определенный моральный кодекс (протокол роботов, полное название «стандарт исключения веб-сканеров») через свои собственные правила игры, юридическая часть все еще устанавливается и Другими словами, это поле пока остается серой зоной. Происходя из анонимности и неотслеживаемости сетевого поведения, она находится в состоянии свободного развития, технология является главной, а правила определяются сами собой.

Однако высокий спрос со стороны бизнеса привлек большое количество людей, которые быстро пополнили ряды практиков. Поиск на крючке: краулер, отображается 252 связанной информации, зарплата от 4к - 70к

Поэтому поисковый робот — это прежде всего компьютерная технология, а сама технология нейтральна. Сами рептилии не запрещены законом.

В обычных условиях технология сканирования применяется только для соблюдения правил веб-сайта.人工访问网络автоматизированная работа. Но есть и люди, которые сажают на него рептилий渗透,暴力破&解,多线程Подождите, пока технология сделает ваш собственный краулер频繁访问, преднамеренный доступ非公开数据

Это приносит риск

почему это незаконно

Сама рептилия легальна, но如何使用爬虫去获取数据Такое поведение рискованно, возьмем пример из жизни:

Рептилия очень похожа на нашего брата на вынос, мы делаем заказ на брата на вынос, и брат идет в магазин, чтобы взять еду на вынос и доставить ее нам. Хорошо, магазин очень доволен, закон также позволяет
С той лишь разницей, что краулеры очень нас слушаются. Поэтому мы попросили моего младшего брата, кстати, привести кассира в магазине. В это время магазин вызовет полицию, и закон накажет вас от лица Луны.

Общие проблемы, вызванные рептилиями:

Чтобы добиться эффективности и производительности в реальном времени, он просто и грубо открыт.频繁请求,多线程爬虫, чрезмерно занимающие ресурсы сервера целевого веб-сайта и влияющие на работу веб-сайта . В тяжелых случаях веб-сайт будет парализован, и доступ к нему будет недоступен.
В личных целях использовать технические средства для обхода ограничений доступа к данным веб-сайтов и кражи несанкционированного контента на веб-сайтах. Более того, украденные данные распространяются в Интернете, так что веб-сайт теряет контроль над своими собственными данными, что приводит к экономическим потерям для владельца веб-сайта.
В целях удовлетворения потребностей частных лиц и предприятий не допускается несанкционированное сканирование защищенного авторским правом контента (романы, статьи, изображения, кино- и телепроизведения), личной информации (вербовка, контент-сообщество, данные о покупках), приводящее к неправомерному копированию и использованию чужих данные.

Особенно с непрерывным развитием экономики Китая все больше и больше внимания уделяется личной информации и правам на интеллектуальную собственность.《中华人民共和国网络安全法》Постоянное улучшение: База данных социальной работы исчезла, пиратский веб-сайт был закрыт, а веб-сайт был взломан и решен для исправления.

Сами сканеры являются законными, но использование сканеров для незаконного получения коммерческих и личных данных также сопряжено с более высоким риском наказания.

Чем опасны сканеры

Технические меры для принудительного взлома настроек сайта

Поскольку массовые посещения поисковыми роботами будут оказывать огромное давление и нагрузку на веб-сайты, многие операторы веб-сайтов будут принимать технические меры, чтобы не допустить, чтобы поисковые роботы получали информацию о своих веб-сайтах.

Идентифицировать сканеры по UA
Установите частоту доступа по IP, если она превышает определенную частоту, появится всплывающий код подтверждения.
Определение сканеров по параллелизму
Статистика фильтрации запрошенного временного окна
Ограничить доступ к одному токену ip/api
Выявление законных поисковых роботов
ресурсы приманки и т. д.

Хотя существует множество различных технологий, по сути, это технические средства для веб-сайтов, предотвращающие пакетное сканирование информации поисковыми роботами, поэтому в законодательстве нет существенной разницы. В ответ на эти технические средства разработчики сканеров могут избежать вышеуказанных технических мер, оптимизировав собственный код, используя пулы IP-адресов и другие методы для обеспечения пакетного сканирования и копирования информации веб-сайта.

Информация, просканированная сканером, является произведением, защищенным законом об авторском праве.

Будь то статьи, изображения, комментарии пользователей в Интернете или даже база данных самого веб-сайта, они могут представлять собой произведение, охраняемое законом об авторском праве, при условии оригинальности. Что касается того, является ли сбор и использование такой информации нарушением авторских прав, автор считает, что:

Что касается поведения при доступе к веб-странице, поскольку сам поисковый робот является лишь имитацией поведения человека при доступе, что касается поведения при доступе, поведение при доступе не является нарушением прав на информацию, к которой может получить доступ сам ручной доступ. Однако, если сам сканируемый веб-сайт установил некоторые технические меры, гарантирующие, что только определенные пользователи могут получить доступ к информации, и сканер нарушает эти ограничения, поведение сканера при доступе можно заподозрить в незаконном или вредоносном поведении, которое разрушает технические меры;
Что касается сохранения данных, то с точки зрения закона об авторском праве суть захвата заключается в воспроизведении информации, поэтому такие действия могут нарушать право владельца авторских прав на воспроизведение. Конечно, в моей стране толерантно относятся к временному копированию. Если хранение такой информации принадлежит
Что касается извлечения и использования данных, если контроллер поискового робота сканирует информацию, а затем публично распространяет полученную информацию на своем собственном веб-сайте, это может еще больше нарушать право на распространение информации в сети.

Информация, просканированная сканером, является коммерческой тайной.

Хотя информацию, раскрытую в Интернете, сложно отнести к коммерческой тайне, поскольку доступ к некоторой информации в Интернете могут получить только определенные пользователи путем принятия технических мер, информация в Интернете может по-прежнему иметь конфиденциальность и конфиденциальность, требуемые коммерческой тайной. пол, возможность составления коммерческой тайны.

根据《反不正当竞争法》第九条，以不正当手段获取他人商业秘密的行为即已经构成侵犯商业秘密。 А последующее использование или разглашение такой информации представляет собой разглашение и использование чужой коммерческой тайны, а также является нарушением коммерческой тайны правообладателя.

Информация, ползанная гусеником, относится к данным, защищенным от недобросовестной конкуренции

В делах Dianping против Baidu о недобросовестной конкуренции и Sina Weibo против Maimai о недобросовестной конкуренции суд установил, что поведение ответчика по захвату и использованию данных на веб-сайте истца без разрешения нарушило принцип добросовестности и общепризнанной морали. , нанести ущерб порядку конкуренции на интернет-рынке и нанести ущерб конкурентному преимуществу истца, что представляет собой недобросовестную конкуренцию.

Сканеры не могут затрагивать личную конфиденциальность

Если сканер собираетИмя гражданина, идентификационный номер, контактная информация для связи, адрес, пароль учетной записи, имущественный статус, местонахождение и другая личная информация., и использование его незаконными способами, безусловно, будет представлять собой незаконный акт незаконного получения личной информации граждан.

То есть у вас нет проблем с лазание информации, но вы не можете затрагивать вопросы личной конфиденциальности, если это связано, то это определенно незаконно.

Кроме того, существуют следующиетри ситуации, рептилии могут нарушать закон и даже представлять собой преступление:

1.Программа-краулер обходит меры защиты от сканирования, установленные оператором веб-сайта, или взламывает и устраняет меры защиты от сканирования сервера и незаконно получает соответствующую информацию., если обстоятельства серьезные, это может представлять собой преступление «незаконное получение данных компьютерной информационной системы».
2.Сканер мешает нормальной работе посещаемого веб-сайта или системы, если последствия серьезны, это нарушает уголовный закон и составляет преступление «уничтожения компьютерных информационных систем».
3.Информация, собранная краулером, относится к личной информации граждан., может представлять собой незаконный акт незаконного получения личной информации граждан, а при серьезных обстоятельствах может представлять собой «преступление в виде нарушения личных данных граждан».

Какие поисковые роботы являются законными?

«Если закон не запрещает это, это лицензия.» Если краулер, как и браузер, получает данные, отображаемые на внешнем интерфейсе (общедоступная информация на веб-странице), вместо частной и конфиденциальной информации в фоновом режиме. веб-сайт, он не слишком беспокоится об ограничениях законов и правил, потому что в настоящее время скорость развития цепочки индустрии больших данных намного превышает совершенство закона.

Наконец

В последнее время я стал свидетелем множества инцидентов, связанных с несчастными случаями с программистами: программисты из Юго-Восточной Азии были избиты, и многие компании, работающие с большими данными, были расследованы. Как обычный программист, я надеюсь, что каждый может уделить больше внимания таким событиям, чтобы напомнить себе.

С осторожностью входите в рискованные отрасли, такие как кредиты наличными, несоответствующие P2P, азартные игры и продукты из черной пятерки. Если компания организует взлом определенных данных веб-сайта или если коллега/друг предлагает слить информацию о компании, нужно быть бдительными, иногда небольшое действие может вызвать проблемы.

Большинство поисковых роботов, используемых нашими компаниями и частными лицами, не представляют проблемы.Нет необходимости, чтобы все подвергались опасности.Пока мы не сканируем личную информацию, не используем поисковые роботы для получения незаконной прибыли, не сканируем платный контент сайта, в основном не имеет проблемы.

Программисты - самая чистая группа людей в мире, а также группа людей с высоким IQ и низким EQ. Работа есть работа, но она также требует надлежащей осторожности. Пожалуйста, держитесь на расстоянии от некоторых вещей, которые находятся на край закона.

Уважайте закон, соблюдайте закон, начните с меня. 图片名称