Как работает антиплагиат

Discussion in 'Болталка' started by GAiN, 29 Dec 2014.

  1. GAiN

    GAiN Elder - Старейшина

    Joined:
    2 Apr 2011
    Messages:
    2,550
    Likes Received:
    172
    Reputations:
    99
    сделал небольшую проверку текста на уникальность, но сам факт не ясен каким образом текст ищет данный сайт

    http://text.ru/antiplagiat/ - при проверки на нём уникального текста, он нашел нужный сайт, но во-первых, на сайте стоят ограничения на доступ, и боты этого сайта не могут войти туда, во-вторых данный текст уже остутствует на страницах, но в поиске ещё остался - кэш страниц выключен, просмотреть кешированную версию нельзя!

    тогда каким образом он нашёл что есть на сайте такой текст ?

    может есть у поисковиков api для доступа к кеш версиям ?
    можно ли посмотреть кэш страницы в поисковых системах, если он скрыт, то есть стоит запрет на кеширование поисковиками ?
    есть ли способ обойти это ?
     
  2. \/IRUS

    \/IRUS Elder - Старейшина

    Joined:
    3 Aug 2012
    Messages:
    379
    Likes Received:
    498
    Reputations:
    37
    некоторые сайты дают доступ к контенту ботам идентифицируя их по Usar-Agent
    частота обновления у ботов динамическая и при высокой частоте обновления сайта может успевать вырвать контент когда он еще доступен в открытом доступе

    а Антиплагиат обычно не содержит исходного текста но приводит его к виду модульной карты ссылок слов, предложений у себя на сервере
     
  3. GAiN

    GAiN Elder - Старейшина

    Joined:
    2 Apr 2011
    Messages:
    2,550
    Likes Received:
    172
    Reputations:
    99
    а может ли поисковую выдачу парсить антиплагиат ? таким образом составляет весь найденый текст, с какого сайта
     
  4. barnaki

    barnaki Elder - Старейшина

    Joined:
    2 Nov 2008
    Messages:
    676
    Likes Received:
    140
    Reputations:
    4
    тс тоетсь ты утверждают что роботы поисковых систем не должны кэшировать результат ? а как тогда тебя искать дружище ? ты знаешь сколько сайтов ? или ты предлагаешь гуглу по каждому сайту пробегать за каждый запрос и смотреть есть ли инфа ? и вообще что за детский сад. какой антиплагиат ? если идея хорошая то все = появтся клоны и плагиаты. тут скорее патентовать надо. но мало вероятно что есть что патентовать
     
  5. BlackIce

    BlackIce Elder - Старейшина

    Joined:
    10 Jan 2013
    Messages:
    100
    Likes Received:
    31
    Reputations:
    27
    парсит яшку
     
  6. sn0w

    sn0w Статус пользователя:

    Joined:
    26 Jul 2005
    Messages:
    1,023
    Likes Received:
    1,296
    Reputations:
    327

    парсит выдачу с поисковиков (первый пост в треде уникален на 0%). что почему и примерно как делают поисковики - https://support.google.com/webmasters/answer/182072


    я хз как с этими ботами и парсят ли они всякие document.write итд, но идея такая: в плейне сайт отдавать должен чтото типа рандомно перемещенного массива пар слово,позиция; и скрипт который в бровсере приведет все в оригинальное состояние.
     
    #6 sn0w, 31 Dec 2014
    Last edited: 31 Dec 2014
  7. barnaki

    barnaki Elder - Старейшина

    Joined:
    2 Nov 2008
    Messages:
    676
    Likes Received:
    140
    Reputations:
    4
    мусье знает толк в извращениях
     
  8. klimentino

    klimentino Banned

    Joined:
    8 Jun 2011
    Messages:
    0
    Likes Received:
    0
    Reputations:
    0
    Так и есть !!! По другому никак. Как мне кажеться text.ru сегодня лучший проверщик на уникальность. Например advego немного хуже, выдает ошибки

     
  9. hpol

    hpol Elder - Старейшина

    Joined:
    11 Dec 2013
    Messages:
    62
    Likes Received:
    16
    Reputations:
    15
    А синонимайзинг текста работает под поисковые или такое палится сразу ?
     
  10. Ипбоюл

    Ипбоюл New Member

    Joined:
    10 May 2015
    Messages:
    31
    Likes Received:
    4
    Reputations:
    0
    Актуальнее вопрос как его обойти без особой мороки...