Recaptcha для чего нужна
Как работает reCAPTCHA?
В обсуждении моего недавнего перевода замечательнейшей статьи про CAPTCHA несколько раз появлялись вопросы насчет reCAPTCHA, а именно как же эта система работает. Под катом я в общих чертах объясню суть reCAPTCHA, наглядно покажу как она работает и каким же образом она цифрует книжки.
Расскажу я все достаточно кратко, но зато понятно. Приведенные иллюстрации были взяты с официального сайта reCAPTCHA
Stop spam
По своей сущности, reCAPTCHA выполняет ту же функцию, которую выполняют другие капчи. Суть проста, вводим предложенный текст и тем самым доказываем, что мы не робот. Главным отличием от других систем является то, что reCAPTCHA не только защищает сайт от спамеров, но еще и выполняет другую, достаточно интересную функцию.
Read books
Как вы наверняка заметили, reCAPTCHA предлагает ввести два слова, что практически не встречается у других капч. Суть в том, что пользователь при вводе этих слов не только доказывает, что он человек, но еще и помогает распознавать старые книги и газеты.
Принцип работы прост:
Допустим, есть энная книга, которая сохранилась в малом количестве экземпляров, при этом все они в плохом состоянии. Один экземпляр в отсканированном виде попал в руки Google (владелец reCAPTCHA). Что с ним делать? Правильно, цифровать (и дело тут не только в сохранении наследия, но об этом позже). Как цифровать? Цифровать, используя системы распознавания символов (OCR). Но, как многим известно, эти системы очень часто грешат многочисленными ошибками в выданном результате. Вручную перебирать весь текст на предмет ошибок — слишком дорогое удовольствие. И вот, на помощь приходит reCAPTCHA. Одно слово в изображении распозналось системой OCR правильно, а вот второе никак нет. Второе слово — за пользователем, именно то, что он введет будет использовано в качестве замены ошибочному варианту, предложенным OCR. Наверняка сейчас некоторые усмехнутся, да, я знаю про то, что фактически вместо второго слова можно ввести что угодно. Но каждое непонятное для OCR слово reCAPTCHA показывает пользователям сотни, а то и тысячи раз (при цифре в 200 миллионов генераций в день это очень мало), и в конечном итоге правильным считается тот вариант, который пользователи вводили чаще всего.
От скучного текста перейдем к иллюстрациям:
Вот так выглядит отсканированный текст. Качество, можно сказать, на высоте, но давайте же взглянем на результат работы OCR:
Красным выделены ошибки. Не правда ли их слишком много? А теперь посмотрим, что же будет результатом работы reCAPTCHA:
Не надо быть семи пядей во лбу, что бы увидеть разницу между OCR и дуэтом OCR + reCAPTCHA. Оцифровка получилась 100% безошибочной.
Разумеется, это что-то вроде идеальной ситуации, где все складывается так, как задумывалось создателями reCAPTCHA. Но наверняка многие из вас сталкивались с абсолютно нечитаемыми словами, предлагаемыми для ввода. Проблема в том, что некоторые книги \ газеты сохранились настолько плохо, что порой и вручную они распознаются отвратительно. Вот пример:
Изображение отвратительного качества. Посмотрим, что тут сможет сделать OCR…
… а ничего. Ошибки не подсвечены потому, что все это — одна большая ошибка.
Зато силами reCAPTCHA результат становится вполне себе читаемым, хоть и не безошибочным.
Именно таким образом пользователи помогают оцифровывать книжки средствами reCAPTCHA. По-моему, это прекрасно.
Я ничего не понял!
Скрипты для распознавания
Бытует ошибочное мнение, что reCAPTCHA невозможно взломать (речь идет об автоматическом распознавании приведенного текста, без участия человека). Однако, судя по тенденциям, это не так. С течением времени reCAPTCHA понаделала различных подводных камней для систем распознавания. Среди них искривление текста, пересечение его полосами, так же недавно была введена фича, благодаря которой проверочное (известное системе) слово выглядит сдвоенным. Все это указывает на то, что reCAPTCHA все таки испытывает некоторые трудности с защитой.
Никто и не подозревал
Есть люди, которые критикуют reCAPTCHA, и с этической точки зрения, критикуют они не зря. Дело в том, что за распознанный текст Google так или иначе получает деньги. А сами тексты добываются вполне себе бесплатно, силами пользователей. То есть, тут имеет место бесплатный труд. Лично меня это не волнует, к тому же, никто не заставляет пользователей вводить reCAPTCHA, и более того, никто не заставляет веб-мастеров устанавливать ее на свои сайты 🙂
Что такое капча – recaptcha, captcha и другие виды, зачем нужна в интернете и как пройти
С понятием «Captcha», ее типами «ReCaptcha» и другими сталкивается практически все пользователи компьютера и интернета.
Чаще всего ее видят обычные пользователи при регистрациях на сайтах, при входе в свои аккаунты на сервисах, при отправке комментариев на блогах или при многократном и частом повторении одинаковых действий, например, лайки, репосты, комментирование.
А потому каждому хорошо бы знать — что такое капча, для чего это чудо применяется в интернете при регистрации и в других случаях, в том числе и для заработка 🙂 как вводить капчу, решать и на какие виды она подразделяется.
А некоторые из нас встречаются с ней не только просто бороздя просторы интернета. Например, имея свой сайт, можно добавить на нем нужный вид капчи для защиты от спама или другой пример — можем сталкиваться с ней при работе в программах и даже можем решать ее за деньги.
Поэтому новичку знать о ней основную информацию очень полезно, (а бывает и нужно!) и сейчас я постараюсь разложить все по этой теме в вашей голове по полочкам 🙂
ЧТО ТАКОЕ КАПЧА И ДЛЯ ЧЕГО НУЖНА?
То есть охраняет ресурсы от автоматических действий на сайтах программами-роботами, например, многократных регистраций, отправок комментариев, добавлений в друзья (если касается соц.сетей) и других.
Если бы не было такого способа защиты на сайтах, то можно себе представить, насколько вольно бы себя чувствовали разработчики всяких ботов, нацеленных на быстрые регистрации тысяч аккаунтов на одном сайте, множественные репосты, лайки в соц.сетях, массовую отправку комментариев, почтовый спам…
В какой-то мере, интернет сейчас превратился бы в помойку из спама, без внедрения такого «щита». Это когда-то более 20 лет назад в сети еще было более-менее спокойно и подобные оборонительные механизмы не требовались.
ВИДЫ КАПЧИ
Как уже упомянул выше, капчи могут быть различных типов, есть попроще, а есть те, которые нам самим сложно сразу решить, что уж там о безмозглых программах говорить 🙂
В некоторых для разгадывания нужно лишь символы повторить с картинки, а где-то решить реальную задачку или пазл, к примеру, собрать, что ботам чаще всего уже не под силу (по крайней мере на данный момент).
Итак, теперь подробнее о видах капч, коих довольно много, причем названия им можно найти разные и постоянно придумываются все новые разновидности, ведь «машины» всё умнеют могут разгадывать сейчас даже весьма сложные задачи!
Поэтому просто разгруппируем их на 3 больших типа, отделив наиболее часто используемые от остальных: captcha, ReCaptcha и другие, например, FunCaptcha.
Что такое captcha
Что такое recaptcha
То есть нам подставляется, как правило, 2 слова из источников, которые мы должны ввести:
Ну а когда рекапчу купила корпорация Google, стали распознавать изображения даже из google карт и аналогичных приложений. Тем самым появился еще один тип рекапчи (версия 2), представляющая собой следующее…
Пример: «отметьте все изображения, где есть автобусы».
Ну и в 2015 году, появилась капча Recaptcha v3 «Я не робот», которая сейчас считается самой простой, удобной и надежной. Нужно только поставить галочку и она либо сразу будет пройдена, либо при подозрениях у системы защиты, нужно будет решить задачу в виде картинок (версия 2).
Другие виды капчи в интернете
Все остальные виды капчи, которые могут представлять из себя в принципе любые задачи, зависящие от фантазии разработчика.
Поэтому некоторые роботам-спамерам обойти крайне сложно, либо вовсе невозможно, ведь пока что еще компьютер не обрел интеллект как у человека 🙂
Вот несколько примеров:
На рисунке №6 видим так называемую фанкапчу (FunCaptcha), где требуется, используя стрелки, повернуть изображение так, чтобы оно выглядело правильно. Не думаю, что сейчас боты способны легко решить такую задачку, тем более что фигурки подставляются разные.
Ну или 1-й пример: выбрать человека с поднятой рукой среди трех вариантов картинок. Пока что не представляю, как программа в данном случае способна определить, во-первых, что требуется сделать, а во-вторых, найти нужную картинку.
ЗАКЛЮЧЕНИЕ
Что такое капча и ее виды, например, ReCaptcha или FunCaptcha, надеюсь объяснил это доходчиво и вы разобрались в вопросе, а если нет, спросите в комментариях, поясню и заодно статью пополню информацией 😊
Всех встречающихся типов скорее уже не перечислить, ведь программисты создают все новые варианты Captcha, стараясь опередить умнеющие с каждым годом компьютерные «мозги», чтобы защитить сайты от ботов и спама.
Но чаще на сайтах используют 1 и 2 тип, т.е. самую простую капчу из слова и всякие варианты рекапчи. А если администратору ресурса видно, что на него пробивается много ботов, спама, то можно поставить другой вид.
На капче, кстати, еще и заработать можно 🙂 или, наоборот, вложить деньги в автоматическое ее разгадывание, когда нужно без проблем работать в программах, выполняющих автоматические регистрации, отправку комментариев и других действия.
На этом все, если по теме заметки остались у вас вопросы, то можете задать их ниже в комментариях, и я вам все растолкую 🙂 Хорошего вам дня и прекрасного настроения! 😉
Сделай репост – выиграй ноутбук!
Каждый месяц 1 числа iBook.pro разыгрывает подарки.
—> LENOVO или HP от 40-50 т.р., 8-16ГБ DDR4, SSD, экран 15.6″, Windows 10
25 комментариев
Автор: Татьяна
Автор: Владимир Белев
Здравствуйте! Эксперимент будет полезным, чтобы просто понять для себя, что это за вариант заработка и стоит ли тратить время. У каждого свои фишки и может получаться по разному.
Автор: Любовь
Владимир, спасибо за интересную статью и подробную информацию про капчу. Не знала, что роботы её разгадывают, да ещё и лучше людей.
Автор: Владимир Белев
Да, сейчас капча разгадывается и роботами, но чаще используют такую схему:
Это применяется сейчас во всех подобных программах.
Автор: Владимир Белев
Здравствуйте! Прошу прощения за долгий ответ, тем не менее если еще актуально, поясню: разгадывание капчи нужно в первую очередь сейчас тем, кто работает с автоматизированными программами. Назначение у таких разное, например: для автоматического постинга в социальных сетях, а также добавления друзей, простановки лайков и любых других действий в соц.сетях. Также есть программы для автоматической отправки сообщения на форумах, блогах. Есть те, которые называются «парсеры» (служат для сбора информации). Например, парсеры поисковых систем, т.е. собирают ссылки на сайты по заданному запросу, собирают информацию из других сервисов. В общем программ много для всевозможных задач.
И такие программы обязательно в свой функционал добавляют возможность решать капчу на автомате. Потому что любые автоматически запросы к сайтам обязательно вызывают капчу (как раз она и нужна для защиты). И вот как пользователь, которому нужно эту капчу разгадывать в программа в автоматическом режиме, я просто выбираю сайт, например, RuCaptcha, загружаю деньги на баланс и в программе разгадывается капча автоматически. Т.е. программа (например, для автопостинга в соц.сетях) сталкивается с капчей и она отправляется в RuCaptcha, где ее решают обычные люди. Когда решена, в программу возвращается результат в виде готовой капчи. Все это происходит очень быстро.
Поэтому необходимость в разгадывании капчи вряд ли утеряет актуальность в скором времени.
На счет задания на 32 шаге: оно очень интересное, потому что позволяет попробовать способ заработка, разобраться в нем. А если не разбираться, а просто писать свои мысли, то и контент получается плохим (такой как раз публикуют многие в интернете).
Владимир Белев, спасибо, начинаю помаленьку понимать. Если можно, поясните еще два момента: Программа, например, для автопостинга сталкивается с капчей, через Rucaptcha пересылает ее, например, мне. Я делаю ошибку, она уходит на сайт, там определяется ошибка, генерируется новая капча и попадает мне же или кому-то другому? И, второй момент: тот или иной сайт генерирует капчу одного типа, а мне будет приходить разнотипная или нет? То есть, могут придти искаженные символы, а за ними сразу какая-то картинка или нет? Спасибо, Владимир.
Автор: Владимир Белев
На счет того, кому попадает капча во второй раз, врать не буду, не знаю 🙂 В такие тонкости не углублялся, не приходилось еще. Хотя вопрос интересный!
А что же касается, какая капча будет приходит, зависит от настроек и сервиса, где вы с капчей работаете. Например, где-то можно выставить получение разных капч, а где-то настраивается максимальный заработок и показываются самые дорогие капчи (это картинки обычно).
Автор: Людмила
Наконец то я узнала что такое капча!
Автор: Владимир Белев
Рад, что понятно разъяснил) Спасибо за комментарий!
Автор: Ольга Коренник
Хочу вставить ссылку на эту вашу статью у себя в блоге. Только вот еще не знаю, прямо так вставлять, надо ли сокращать, относится ли она к простым ссылкам или как партнерская выступает?
Автор: Владимир Белев
Здравствуйте! Ссылку просто скопируйте из адресной строки браузера и вставляйте на свой блог или куда-либо еще. Ссылка на саму статью не является партнерской.
Ваша статья помогла разобраться в видах капчи. А то я думала, что рекапча это только картинки. Теперь свою статью буду корректировать.
Автор: Владимир Белев
Отлично, что разобрались! Да, капча штука запутанная, их столько всяких видов и при этом некоторые дают свои названия определенным видам капчи, от чего еще больше путаницы.
Что только не придумают люди! Вообще, удивляюсь этим мозговитым товарищам)
Автор: Владимир Белев
Точно, прогресс не стоит на месте и компьютерная сфера развивается с невероятной скоростью.. В скоре наверное придумают что-то взамен капчам, чтобы моментально отличать робота от человека на сайте.
Ну, ты крут! Я тут пытаюсь статью про заработок на капче написать. И, попробовав, решила писать про то, что не рекомендую ее разгадывать и почему не рекомендую. Про всех этих мошенников и как мы им помогаем, разгадывая капчу через прокладки-сайты типа рукапча. Так вот, начитавшись в инете разных материалов, нашла элементарно в википедии информацию как роботы разгадывают капчу с нашей же помощью рядовых пользователей. В статье: Капча. Раздел способы прохождения капчи роботом. Будет время загляни там в последний пункт, найдешь ответ на вопрос как роботы чужими-человечкими руками разгадывают даже сложные капчи (кроме простейшей, когда нужно поставить галочку :)) )
Автор: Владимир Белев
Спасибо за интересный комментарий! Да, про капчу я уже и после статьи инфу изучал, с чем-то соглашусь, с чем-то и нет, но в принципе как все устроено сейчас понимаю) Спасибо!
Автор: Наталья
В статье «О себе» вы Владимир сетовали, что не смогли преподавать студентам. Я с удовольствием прочитала вашу статью о капче и перестала бояться «этого зверя». Когда я сама пыталась разобраться- НИЧЕГО не поняла: что, зачем и как с ней «общаться». Теперь заинтересовалась и обязательно попробую. Спасибо.
Автор: Владимир Белев
Одно дело преподавать в реальности, другое дело удаленно 🙂 Разница как оказалось огромная, мне так удобнее. Да и дело еще в том, что студенты идут учиться с неохотой, чаще заставляют родители, а в интернете чему-либо люди учатся по собственному желанию.
Оставить комментарий
Подписка на статьи
Делюсь интересной информацией не только на блоге, но и в социальных сетях!
YouTube Instagram Facebook Вконтакте Одноклассники Twitter
Как работает ReCAPTCHA от Google: Самообман и раздвоение личности
Основатель Silktide, Оливер Эмбертон рассказал о том, насколько сложен и опасен для ботов маленький флажок «Я не робот» от Google. Действительно ли всё так серьёзно?
Мы в Бот-факторе порассуждали на эту тему, учитывая то, что недавно было объявлено о создании бота, который проходит первый уровень капчи за несколько секунд, и не только.
А количество новых светофоров, будет зависеть напрямую от истории вашего IP и браузера:
Последние технологии Google, отслеживают самые «микроскопические» изменения в «отпечатках пальцев» вашей Google-личности: часовой пояс и время вашего компьютера; IP-адрес и приблизительное местоположение; размер экрана и разрешение; браузер, который вы используете; плагины, которые вы используете; сколько времени потребовалось для отображения страницы; сколько нажатий клавиш, щелчков мышью и нажатий / прокрутки было сделано; процент «странного поведения», количество ваших характеров (типов личности, вашего раздвоения личности), списка настроений, и многое другое.
Поведению ботов на сайте задаются убедительные задержки, спотыкания при наборе букв, ошибки в словах.
Оливер Эмбертон убежден, что reCAPTCHA от Google слишком занята собственным самообманом, для того чтобы запутать ботов; а ботоделы заняты обманом Google; и эта гонка перевооружения прекратится лишь когда мировой прогресс ИИ достигнет наиболее качественного превосходства в своей сфере.
Действительно ли reCAPTCHA кому-то из нас помогала? Есть ли в ней хоть что-то полезное, кроме отправки своих данных в Google, для их последующей интеграции в основу рекламных продуктов?
Рад, что вы перешли со Spark на Vc, учтите что здесь выше конкуренция, и больше брызжущих желчью завистников-хейтеров. Один дурак подумал, что это перевод и ляпнул, что его мозгам это непонятно, другие поддержали)) тем не менее 1,7к чтений. возвращайтесь кстати к политической повестке, было круто;)
Какие-то обрывки мыслей. Что хотел сказать автор? Зачем эта статья на VC.ru? Интересная тема, из который вырезали саму суть.
Ну ИИ стоит научить хотя бы классике жанра: завязка, развитие, описание проблемы, решение, вывод. А то по строчке из какой-то, не сомневаюсь, полезной статьи достали и как-то скомкано изложили непонятно что хотя сказать.
А также задан риторический вопрос, подумайте наконец, нужна ли вам капча или устанавливаете ее по закону жанра, до кучи? Почему например нет капчи у vc, икеи, рибок, да вообще провести бы анализ, кто её ставит? В этом смысле хотелось бы больше эмпирического от автора.
Одного киборга нашли, товарищ майор
тогда уж товарищ старший уорент-офицер 4 класса
Это разве не способ обучения ультраглобальной нейросети для дальнейшего ее использования в беспилотных автомобилях?
Для пользователя плюсов от рекапчи нет, а для владельцев сайтов очень даже.
Перевод для тех, кто не понял сути: капча от гугла не просто картинка или защита от бота. Капча собирает наши данные, и пытается их всячески маскировать, чтоб не стырили. Но при такой-то защите, их всё равно тырят.
43 человека никогда не устанавливали на сайт капчу: половина из них считает её бесполезной, половине было некогда установить;
23 человека пользуются капчой, и считают её эффективной для сайта;
7 человек установили её просто так;
В статье о том, что такое современная капча от google
Tech PR, который мы заслужили
Да, это не попса в стиле «Цените какой я успешный» или «Миллион уникальных советов в новой интерпретации», и конечно не новость о том, как Греф чихнул в офисе и его тут же медиа облизали, выплюнув инфо.повод 🙂
Вы в шаге от того, что в 2019 году называют «токсичностью», на вашем месте попридержал бы коней.
Не раскроете данное определение?
Источаете желчь без повода — мало кому это будет нравиться.
На мой взгляд, это ответ иронией (смайл же стоит) на иронию.
Я не преследую цели, упрекнуть вас в обслуживании Сбербанка, например.
И тем более, мне не завидно, что я не Греф. Серьёзно, это просто бизнес.
Спасибо.
Да я не про себя, в целом — в дальнейшем такой стиль общения будет вам сильно мешать. ред.
Вот в чем вы не разобрались:
— Я не имею ничего против политики VC, и контекста популярных материалов;
— Я тоже, очень сильно хочу, и люблю писать «попсу».
— Я стараюсь это делать, и подмечаю: «Да, [к сожалению] пока что, это не так [это ещё не попса]».
Я про все ваши комментарии в целом, а не про этот. Аналитический аппарат у вас немного сбоит 🙃И на свой счёт я ничего не принимал, если честно, не знаю, с чего вы это взяли. ред.
А по мне, так ваши аналитические волны не достают до моих 🙂
Ну вот это как раз то, о чём я говорил. Ладно, просто будьте аккуратнее, пожалуйста.
Снисходительный тон — это именно то, к чему нужно прибегать, когда вас просто просят не хамить другим людям на площадке, да.
Или вы имеете в виду себя, мою оценку вашей мнительности?
Ну, на каждого заведена своя папочка, не волнуйтесь!
Я вас понял! Спасибо!
Капча конечно бывает очень назойливой. Но я отношусь к ней скажем, как к необходимому злу. Хотя как на форуме говорят можно использовать ботов для обхода капчи https://captchaforum.com/ мне кажется это немного лишнее. Хотя конечно у каждого свой взгляд на данные вещи. Но я думаю, что проще вручную капчу вводить самостоятельно или же использовать различные сервисы для этого.
Меня зовут Татьяна Карачевцева, в свое время я переехала из Харькова и Киев, а оттуда перебралась в Софию. Здесь уже как HR-менеджер помогла многим коллегам адаптироваться к жизни и работе в Болгарии. Совместив личный и профессиональный опыт, я попробовала собрать подсказки для обеих сторон, вовлеченных в процесс релокации. Какие стадии адаптации…