Сервис распознавания капч, который больше не нужен / Хабр

Dinxor

Python *Обработка изображений *Машинное обучение *

Я уже рассказывал про свой опыт в области распознавания капчи. Разумеется, кроме чисто академического интереса у меня был и материальный — иногда приходится скачивать несколько файлов с обменника, а ждать паузу и вводить капчи я не люблю. Поэтому и пользуюсь программой для закачек под названием Universal Share Downloader, или сокращённо USD. Недавно сервис обмена файлами Turbobit в очередной раз внёс изменения в свой сайт, в результате чего моя программа оказалась бесполезной. Теперь я могу рассказать о сервисе распознавания поподробнее, уже не опасаясь приблизить этот момент. Может, рост числа бесплатных скачиваний в результате использования сервиса уже повлиял. Или это просто традиционная июньская пакость от обменника — то капчу поменяют, то скорость скачивания урежут.

Ну как так то?

У USD есть активное сообщество, в котором разрабатываются и распространяются плагины для поддержки различных файлообменников. Там я выкладывал свою программу для распознавания капчи, чтобы облегчить процесс скачивания всем желающим. Версии с Тессерактом, потом с нейросетью и окончательный вариант — с использованием веб-сервиса на Heroku. Капча представляла собой довольно известную в прошлом Kohana, сейчас такая больше нигде не используется и спамерам неинтересна. Отправка файла осуществлялась РОST запросом. Экспериментальная клиентская часть была написана на Пайтоне, потом для сокращения размера и помещения в сборку я переписал её на AutoIt. Это вызвало проблемы с защитником в Windows 10 — он не оценил идею отправлять файлы куда-то в интернет (а может, совпали какие-нибудь сигнатуры) и стал её блокировать. И тут меня осенило: лучшая программа — это её отсутствие. Я связался с разработчиком плагина и предложил поместить отправку файла на распознавание прямо в плагин Турбобита.

Правда, для этого пришлось добавить в сервис возможность приёма файлов в виде Base64 текста.

Технически сервис представлял собой Flask приложение на Heroku, распознавание с помощью Keras и Tensorflow. Мне удалось уложиться в ограничения бесплатного использования — потребление дискового пространства составило 430 Мб. В самом начале принимались файлы, по которым можно было судить о номере попытки — в случае неудачи следующий файл шёл с другим именем. Я пытался вести статистику, но периодически прилетали серии с не зависящими от очерёдности именами — возможно, кто-то использовал сервис для разметки своих файлов. С отправкой капч в виде Base64 имена файлов стали недоступны, и я стал просто считать капчи. Сохранение файлов реализовал следующим образом: картинка и результат добавляются в словарь, при достижении нужного количества в памяти создается zip архив и капчи переносятся туда с добавлением к имени метки времени, затем архив отправляется на хранение. Бесплатный сервис на Heroku автоматически перезапускается примерно раз в сутки или при бездействии в течение 30 минут.

При таком подходе часть капч теряется в случае перезапуска сервиса, но задачи сохранить абсолютно всё и не ставилось. Потом добавил возможность просмотра последней распознанной картинки. Правда, из-за того что страница с текстом и картинка запрашивались не одновременно, иногда можно было увидеть капчу, совсем не соответствующую тексту. Решил не исправлять, всё равно кроме меня никто эту страницу не смотрит. В какой-то момент добавил возможность просмотра собственного IP адреса — почему бы и нет, когда уже есть постоянно работающий сервис?

Два варианта интерфейса для отладки

Сервис проработал около 8 месяцев, количество распознаваемых файлов за сутки колебалось от полутора до трех тысяч, были всплески до шести. Тренировал нейросеть несколько раз на 15000 файлах, последний раз в январе с учетом 250 обнаруженных за месяц ошибок. Логи я не сохранял, сами файлы в целях контроля точности можно было паковать в архивы и отправлять на Cloudinary. Включал сохранение два раза на пару месяцев, теперь у меня есть полтора гигабайта распознанных капч — чуть более 300 тысяч файлов.

Судя по сохраняемым именам, явных ошибок там всего 13 штук, неявных при выборочном просмотре обнаружить не удалось. По-моему, неплохая точность распознавания, сам такого не ожидал.

Обнаруженные ошибки распознавания

Код программы доступен на GitHub, настройки Heroku и ключи авторизации Cloudinary передаются через переменные окружения.

Теги:

  • captcha
  • python
  • ocr
  • neural networks
  • алгоритмы
  • нейросети
  • распознавание текста
  • капча

Хабы:

  • Python
  • Обработка изображений
  • Машинное обучение

Всего голосов 4: ↑4 и ↓0 +4

Просмотры

6.7K

Комментарии 2

Алексей @Dinxor

Пользователь

Комментарии Комментарии 2

Модуль программа распознавания капчти Xevil 5 6 Сервис распознавания Google ReCaptcha, hCaptcha, Yandex Captcha, FunCaptcha

$$$$$$$$$$$

ОТКРЫТА раздача купонов, СУПЕР скидка 35-55%

+ всем купившим Standart и Business версииXEvil 5

Спешите занять Ваше место в листе продаж!

Перейти в раздел о покупке посредством купонов

$$$$$$$$$$$

NEW! Настройка прокси серверов для XEVIL (решения Recaptcha) под ключ

Здравствуйте Друзья!

Январь 2017 года, стал ярким событием в многолетнем развитие программного комплекса Xrumer.

Вышедший модуль XEvil, не имеет аналогов в мире, по скорости и точности распознавания каптч (защитных изображений), только подумайте, скорость распознавания составляет 100 изображений в секунду, что никогда не смогут предоставить сервисы ручного распознавания (антикаптча, antigate и др.), тем более они берут за это деньги, а приобретая программу распознавания каптчи Xevil, Вы не будете далее тратить свои деньги на данные нужды.

А ГЛАВНОЕ!, Вы сможете применять его абсолютно к различным программам, работающим на одной машине, с установленном программным комплексом Хрумер.

Сложно поверить, но Xevil это софт который способен распознавать всем надоевшую уже Google ReCaptcha, Yandex-Captcha, Solve Media, там где приходится выбирать дорожные знаки, искать витрины и порой это ставит в тупик и приходится нервничать и терять время на работу(

Программа / модуль распознавания капчи Xevil, с радостью возьмет под свой контроль все процессы рутинного распознавания абсолютно любых видов каптч.

Стоит отметить, что модуль Xevil не продается отдельно, а идет в комплексе лицензий Стандарт и Бизнес, при покупке программного комплекса Хрумер, условия покупки можно изучить по данной ссылке.

Официальный сайт Xevil, представлен по ссылке – http://xevil.net/ru/

Вы сможете ознакомиться с демо версией, проверить принципы работы и принять решение о покупке программного комплекса Хрумер.

По всем вопросам покупки Xevil, просим Вас обращаться к Нашим специалистам.

С уважением к Вам, SaleSeo Xrumer Branch!  

Публикации

Посмотреть все публикации

Новости

02.06.22 До выхода XEvil 6.0 остались считанные дниРады сообщить, что до выхода XEvil 6.0 остались считанные дни — на форуме сегодня было опубликовано пред-релизное видео с многопоточным решением hCaptcha.Читать >>

03.04.22 Релиз XEVIL 5.0 состоялся! Релиз XEVIL 5. 0 состоялся! Теперь новая версия программы доступна всем владельцам лицензии «Стандарт» и «Бизнес» без какой-либо дополнительной оплаты!Читать >>

11.11.21 Важное обновление: XEvil 5.0 [Beta-9], XRumer 19.0.9, SocPlugin 4.0.78Улучшения и исправления в XEvil 5.0 [Beta-9] + в новый 64-битный модуль включена поддержка Яндекс-капчи (подтип «двусловная волнистая»), благодаря чему: — скорость распознавания этой капчи выросла в среднем в 4(!) раза — снижена ошибка распознавания на 20-30% — повышена стабильность распознаванияЧитать >>

05.07.21 Сегодня состоялось долгожданное обновление XRumer, а также XEvil 5.0 [Beta]Уважаемые пользователи! Сегодня состоялось долгожданное обновление XRumer, а также XEvil 5.0 [Beta] (под данное обновление хрумера), которое повышает эффективность софта в десятки раз. Мы очень благодарны за ваше терпеливое ожидание, и мы уверены, что оно того стоило — ещё в первые часы релиза мы получили много восторженных отзывов ????Читать >>

02. 06.21 Анонс XRumer 19.0.8: прирост эффективности в 20-30 раз! Уважаемые пользователи! В прошлую пятницу, перед масштабным обновлением XRumer-а, мы провели традиционное сравнение старой и новой версии XRumer-а: 19.0.7 и 19.0.8, старая отработала с XEvil 4.1.36, новая — соответственно, с новым XEvil 5.0 [Beta-5]. Как и раньше, процесс состоял из нескольких этапов: сначала проход в режиме «Только регистрация» по небольшой тестовой базе в несколько итераций в течение недели, после — обычный постинг в режиме «От ранее зарегистрированного» в течение 12-ти часов: с 12-00 до 23-59. Читать >>

Посмотреть все новости

Сервис разгадывания капчи, Распознавание и обход reCAPTCHA, Fast Auto Anti Captcha

Процесс разгадывания обычной капчи выглядит следующим образом: берем изображение капчи со страницы и отправляем в сервис, где сотрудник разгадывает ее, набрав указанную текст, то нам возвращается ответ, который необходимо ввести в соответствующее поле для решения капчи

API demoКак решить

Процесс решения текстовой капчи выглядит следующим образом: берем текст вопроса капчи со страницы ее размещение и передача в сервис, где она решается сотрудником, после чего нам возвращается ответ, который необходимо ввести в соответствующее поле для решения капчи

API demoКак решить

Процесс решения следующий: берем изображение капчи со страницы ее размещения и инструкцию на какие картинки кликать и передаем в сервис, где ее решает сотрудник, после чего ответ возвращается нам в виде набора координат точек, которые нам нужно нажать для решения капчи

API demoКак решить

Процесс решения Rotate Captcha выглядит следующим образом: берем изображение или несколько изображений капчи из страницу ее размещения и передать в сервис, где ее решает сотрудник, после чего нам возвращается ответ в виде значения угла поворота изображения, нам нужно повернуть изображение на угол для решения капчи

API demoКак решить

Процесс решения reCAPTCHA V2 выглядит следующим образом: берем параметры капчи со страницы в виде параметра data-sitekey и URL страницы и передаем в сервис, где ее решает сотрудник, далее нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи

API demoКак решить

Процесс решения reCAPTCHA V2 Callback не отличается от аналогичного процесса решения reCAPTCHA V2 : мы берем параметры капчи со страницы в виде параметра data-sitekey и URL страницы и передаем в сервис, где ее решает сотрудник, далее нам возвращается ответ в виде токена, который мы должны ввести в соответствующее поле для разгадывания капчи. Иногда вы не найдете кнопку отправки формы. Вместо этого можно использовать функцию обратного вызова. Эта функция выполняется, когда капча распознана. Обычно функция обратного вызова определяется в параметре обратного вызова данных или в качестве параметра обратного вызова вызова метода grecaptcha.render

API demoКак решить

Процесс решения reCAPTCHA V2 Invisible аналогичен распознаванию reCAPTCHA V2: берем параметры капчи со страницы в виде параметра data-sitekey и URL страницы и передаем в сервис, где ее решает сотрудник, после чего нам возвращается ответ в виде токена, который нам нужно ввести в соответствующее поле для решения капчи

API demoКак решить

Процесс решения reCAPTCHA V3 выглядит следующим образом: мы взять параметры капчи со страницы в виде data-sitekey, action и URL страницы и передать в сервис, где решается сотрудником с соответствующим рейтингом «гуманность», после чего ответ возвращается на нам в виде токена, который необходимо ввести в соответствующее поле для решения капчи. Во многом новый вид капчи похож на reCAPTCHA V2, т.е. основной принцип остается прежним — пользователь получает токен от в API, который отправляется в POST-запросе на сайт, и сайт проверяет токен через API

API demoКак решить

Процесс решения reCAPTCHA Enterprise выглядит следующим образом: определяем тип reCAPTCHA, это может быть V2 или V3, после чего берем изображение капчи со страницы ее размещения в виде данных- параметр sitekey и передать его в сервис, где он решается сотрудником, после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи

Как решить

Процесс решения KeyCaptcha выглядит следующим образом: мы берем набор необходимых параметров со страницы его размещения и передаем сервису, где сотрудник его решает, после чего нам возвращается ответ в виде набора других параметры, которые необходимо передать в соответствующие поля для решения капчи

API demoКак решить

Процесс решения GeeTest Captcha выглядит следующим образом: мы берем набор необходимых параметров со страницы ее размещения и передаем в сервис, где сотрудник ее решает, после чего нам возвращается ответ в виде набора уже других параметров, которые необходимо передать в соответствующие поля для решения капчи

API demoКак решить

Процесс решения следующий: берем изображение капчи со страницы ее размещения и передаем на сервис, где ее решает сотрудник, после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи

API demoКак решить

Процесс решения FunCaptcha от Arkose Labs выглядит следующим образом: берем набор необходимых параметров со страницы ее размещения и передаем в сервис, где сотрудник решает, после чего возвращается ответ нам в виде набора уже других параметров, которые необходимо передать в соответствующие поля для решения капчи

Как решить

Процесс решения Capy Puzzle Captcha выглядит следующим образом: берем набор необходимых параметров из страницу ее размещения и передать в сервис, где ее решает сотрудник, после чего нам возвращается ответ в виде набора уже других параметров, которые необходимо передать в соответствующие поля для решения капчи

Как решить

Captcha Solving Service.

Автоматическое онлайн-распознавание и быстрый обход капчи. Best Anti Captcha API
  • От $1.00 за 1000 капч
  • Простая интеграция API
  • Скорость решения менее 12 секунд

— это сервис, созданный для автоматизации сервиса распознавания капчи.

Все капчи разгадываются рабочими, поэтому www.2captcha.com может обходить все человекочитаемые типы капч.

Сервис полностью автоматизирован, поэтому вы один раз настраиваете свое ПО, после чего можете забыть о разгадывании капчи и возвращаться обратно только для пополнения баланса.

Начать сейчас

Как автоматически решать капчу

  • Загрузить капчу на www.2captcha.com/in.php

  • Сервер сохраняет вашу капчу и немедленно возвращает вам идентификатор вашей капчи

    4
  • 4 раздает вашу капчу воркеру

  • Воркер решает капчу и отправляет ответ обратно на сервер

  • Вы отправляете запрос на сервер, используя свой ID, чтобы получить ответ

Поддерживается обход капчи

reCAPTCHA V2

$1. 00 — $2.99 ​​
Цена за 1000

26 сек.
Решение скорости

Поддержанный API:

ПАРАМЕР. data-sitekey и URL страницы и передать его в сервис, где сотрудник его решает, после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи

Демонстрация APIКак решить

Быстрый старт

hCaptcha

2,99 $
Цена за 1000

22 сек.
Решение скорости

Поддержанный API:

. сервис, где ее решает сотрудник, после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи

Демонстрация APIКак решить

Быстрый старт

reCAPTCHA V3

$1,45 — $2,99
Цена за 1000

5 сек.
Решение скорости

Поддержанный API:

. ПАРМОЛЕТА ПАРАМЕТА С ФОРМАПТА. data-sitekey, action и URL страницы и передать в сервис, где решается сотрудником с соответствующим рейтингом «человечности», после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи.Во многом новый тип капчи похож на reCAPTCHA V2, т.е. основной принцип остается прежним — пользователь получает токен от API, который отправляется в POST-запросе на сайт, а сайт проверяет токен через API

Демонстрация APIКак решить

Быстрый старт

FunCaptcha

2,99 $
Цена за 1000

15 сек.
Решение скорости

Поддержанный API:

Процесс. ее размещение и передача в сервис, где ее решает сотрудник, после чего нам возвращается ответ в виде набора уже других параметров, которые необходимо передать в соответствующие поля для решения капчи

Как решить

Быстрый старт

GeeTest CAPTCHA

2,99 $
Цена за 1000

13 сек.
Решение скорости

Поддержанный API:

и передать его в сервис, где его решает сотрудник, после чего нам возвращается ответ в виде набора уже других параметров, которые необходимо передать в соответствующие поля для решения капчи

Демонстрация APIКак решить

Быстрый старт

reCAPTCHA Enterprise

$1.00 — $2.99 ​​
Цена за 1000

24 сек.
Решение скорости

Поддержанный API:

Процесс Solving Recaptch OR Entecprise ve we e we shepprise ves we we shepprise ve we shepprise ves we e we shepprise ve we shepprise ve we ves ves rete ves ves ves ves ves ves shepprise ves we seatsha ves ves ves ves sheprise. , после чего мы берем изображение капчи со страницы ее размещения в виде параметра data-sitekey и передаем в сервис, где она решается сотрудником, после чего нам возвращается ответ в виде токен, который необходимо ввести в соответствующее поле для решения капчи

How to solve

Quick start

More anti captcha solutions

  • Normal captcha
  • Text captcha
  • Click captcha
  • Rotate captcha
  • reCAPTCHA V2 Callback
  • KeyCAPTCHA
  • reCAPTCHA V2 Invisible
  • Capy Puzzle CAPTCHA

Обычная капча

$0. 50 — $1.00
Цена за 1000

5 сек.
Скорость решения

Поддерживаемый API:

Процесс разгадывания обычной капчи со страницы сотрудника, и отправляем ее на страницу с капчи решает ее, набрав указанный текст, затем нам возвращается ответ, который необходимо ввести в соответствующее поле для решения капчи

API DemoКак решить

Быстрый старт

Текстовая капча

$0,50 — $1,00
Цена за 1000

5 сек.
Решение скорости

Поддержанный API:

. размещение и передать его в сервис, где он решается сотрудником, после чего нам возвращается ответ, который необходимо ввести в соответствующее поле для решения капчи

API DemoКак решить

Быстрый старт

Нажмите капчу

1,20 $
Цена за 1000

13 сек.
Решение скорости

Поддержанный API:

. картинки кликнуть и передать в сервис, где сотрудник ее решает, после чего нам возвращается ответ в виде набора координат точек, которые нам нужно нажать для решения капчи

API DemoКак решить

Быстрый старт

Повернуть капчу

0,50 $
Цена за 1000

5 сек.
Решение скорости

Поддержанный API:

. ее размещения и передать в сервис, где ее решает сотрудник, после чего нам возвращается ответ в виде значения угла поворота изображения, нам нужно повернуть изображение на угол для решения капчи

Демонстрация APIКак решить

Быстрый старт

Обратный вызов reCAPTCHA V2

$1.00 — $2.99 ​​
Цена за 1000

25 сек.
Решение скорости

Поддержанный API:

. параметры со страницы в виде параметра data-sitekey и URL страницы и передать в сервис, где решает сотрудник, далее нам возвращается ответ в виде токена, который мы должны внести в соответствующий поле для разгадывания капчи. Иногда вы не найдете кнопку отправки формы. Вместо этого можно использовать функцию обратного вызова. Эта функция выполняется, когда капча распознана. Обычно функция обратного вызова определяется в параметре обратного вызова данных или в качестве параметра обратного вызова вызова метода grecaptcha.render

API DemoКак решить

Быстрый старт

KeyCAPTCHA

2,99 $
Цена за 1000

14 сек.
Решение скорости

Поддержанный API:

. передать ее сервису, где ее решает сотрудник, после чего нам возвращается ответ в виде набора других параметров, которые необходимо передать в соответствующие поля для решения капчи

API DemoКак решить

Быстрый старт

reCAPTCHA V2 Invisible

$1. 00 — $2.99 ​​
Цена за 1000

24 сек.
Speed ​​Speed ​​

Поддержанный API:

. страницу в виде параметра data-sitekey и URL страницы и передать в сервис, где решает сотрудник, после чего нам возвращается ответ в виде токена, который нам нужно ввести в соответствующее поле решить капчу

Демонстрация APIКак решить

Быстрый старт

Capy Puzzle CAPTCHA

2,99 $
Цена за 1000

7 сек.
Решение скорости

Поддержанный API:

размещение и передать его в сервис, где его решает сотрудник, после чего нам возвращается ответ в виде набора уже других параметров, которые необходимо передать в соответствующие поля для решения капчи

Как решить

Быстрый старт

Решение для обхода капчи на GitHub

Полная документация и примеры кода обхода капчи на Github

  • Как решить капчу с помощью C++

    Библиотека C++ для автоматического ввода капчи. Лучший онлайн-сервис автоматического решения капчи. API можно интегрировать в любой скрипт.

    API решения капчи C++
  • Как решать капчу с помощью C#

    Библиотека C# для распознавания капчи. Простая интеграция с сервисом решения капчи API для обхода капчи.

    API решения капчи C#
  • Как решить капчу с помощью Go

    Модуль Golang для декодирования капчи онлайн. API быстрой интеграции для разгадывания капчи.

    Go API решения капчи
  • Как решать капчу с помощью Java

    Библиотека Java для быстрого обхода проверки капчи. Лучший онлайн-сервис для решения капчи. Простой API для решения капчи.

    API решения капчи Java
  • Как решить капчу с помощью PHP

    Пакет PHP для решения по автоматизации обхода капчи. Лучший показатель успешного распознавания капчи.

    PHP API для решения капчи
  • Как решить капчу с помощью Python

    Пакет Python для автоматического решения капчи на любом сайте. Полностью положитесь на стабильное решение для распознавания капчи и забудьте об эмуляции браузера. Примеры кодов

  • — это сервис по разгадыванию капчи с участием человека. 100% капчи разгадываются людьми со всего мира. Поэтому может помочь обойти любую проверку капчи.

  • Используйте API для отправки любых капч решателям капчи. позволяет разработчикам легко интегрировать любые функции распознавания капчи.

  • Нужно индивидуальное решение? позволяет создать решение для распознавания любого типа капчи.

Заказать Капчи

  • Сервис позволяет распознавать и распознавать любые человекочитаемые капчи, которые может распознать человек. Кроме того, сервис может распознавать не только текстовую капчу, но и любую графическую капчу, например, reCAPTCHA V2, Asirra, FunCaptcha и другие. Ставки довольно низкие и начинаются от $0,001 за капчу. Для удобства мы показываем все тарифы за 1000 капч, но тарификация основана на разгадке отдельных капч. Разные типы капч имеют разную скорость.
  • Обычные капчи: 0,50–1,00 $ за 1000. Обычные капчи — это капчи, когда вам нужно ввести текст, показанный на картинке. Ставка зависит от загруженности службы. Если нагрузка низкая, цена ниже. Если нагрузка большая, скорость увеличивается. Статистика показывает среднюю скорость в час за последние дни.
  • reCAPTCHA v2 изображения: $1,00 — $2,99 за 1000. Большая капча — это изображение, сумма высоты и ширины которого превышает 400 пикселей. Наша ставка фиксирована и составляет 1,00–2,99 доллара США и не зависит от нагрузки на сервис. reCAPTCHA v2 images — изображения из reCAPTCHA, на которых нужно выделить соответствующие квадратики.

Скидки

Если вы тратите более 90 000,00 ₽ в день в течение месяца, и вы не являетесь рефералом другого пользователя и не используете какое-либо программное обеспечение из нашего каталога, то вы можете отправить запрос в службу поддержки, и мы сможем предложить скидку для вас.