Статьи Эффективный поиск

Discussion in 'Статьи' started by А®ТеS, 5 Dec 2006.

  1. А®ТеS

    А®ТеS Active Member

    Joined:
    25 Nov 2006
    Messages:
    198
    Likes Received:
    193
    Reputations:
    41
    Тема google hack довольно таки избитая, но в этой статье я постарался рассказать как можно более полно об этом поисковике, а также упомянул и Яндыкс...Короче читать тута)):
    Эффективный поиск aka ломаем поисковиками ​
    Многие уже знают, что поисковыми машинами можно искать не только супер-мега порнушку, но и уязвимые скрипты, открытые для общего доступа (aka 200) базы данных и файлы с паролями от админки пентагона :)). Но весь фокус в том, что знают то многие, а умеют не все. Сегодня я постараюсь осветить более подробно этот этап взлома.​
    Итак поехали: пункт первый - Google (для нас - google.com; google.ru). Сначала немного о логике системы: по умолчанию Google ищет используя логический оператор AND (и). То есть все слова в запросе. Например если в форме мы пишем "Antichat team" (без кавычек), то Google интерпритиреут это как "Antichat AND Cool AND Team", кстати Google система регистронезависимая, так что ей по фиг большими или маленькими буквами ты пишешь. Но мы отвлеклись от операторов: как сделать, чтобы выдавался результат, даже если там только одно слово из запроса? Очень просто: используем логический оператор OR (или), и наш запрос превращается в "Antichat OR Cool OR Team" (в этот раз оператор пишем). Кстати вместо OR можно использовать | - это то же самое. Т.е. запрос будет выглядеть "Antichat | Cool | Team". Завершая обзор логических элементов хочу ометить еще одну конструкцию:​
    предположим нам надо найти анекдоты либо о хакерах либо о ламерах. Для этого забиваем строку типа "анекдоты про (ламеров OR хакеров)". На будущее: я использую кавычки ТОЛЬКО для отделения запросов от текста статьи (НЕ надо вбивать их в поиковик), когда нужно будет использовать кавычки я скажу. И еще к примеру мы ищем книгу о хакерах, но на халяву. Тогда озадачиваем Google запросом: "книга о хакерах -цена". Т.е. получается, что минус(-) есть собой исключающая опция, и слово после нее не должно быть результате поиска.​
    Теперь, когда я надеюсь мы немножко разобрались с логикой, можно перейти к опциям поиска вложенным в Google. Пааехали:​
    Опция первая: intitle. Позволяет искать в заголовке документа, т.е. в контейнере
    HTML:
    <title></title>
    
    Пример использования: "intitle:анекдоты", то получите список ресурсов у которых в заголовке есть слово анекдоты. Но как это может помочь во взломе спросишь ты: элементарно, предположим мы знаем что у какой нибудь CMS системы управления сайтом в админке заголовок: Добро пожаловать в админ-панель. Забиваем строку типа:"intitle:Добро пожаловать в админ-панель" и наслажаемся результатом (!!!пример выдуман мной, может такого вообще не существует!!!).​
    Опция вторая: inurl. Ищет в адресе ресурса, в его URL(URL -universal location resourse - универсальный указатель ресурса). Например (в этот раз пример вполне реальный), нам известно, что бажный движок интернет-магазина shop-script имеет скрипт index.php использующим переменную aux_page. Замечательно, забиваем "inurl:index.php?aux_page=" и получаем ссылки на более чем 500 магазинов использующих уязвимый движок. Для тех кто недопонял, имя файла тоже входит в URL, например (опять вполне реальный пример) , если мы забьем "inurl:index.php?aux_page=", то там среди прочих будет ссылка на http://chronos.rond.net/index.php?aux_page=. Но если мы забьем "inurl:chronos.rond.net" (часть URL), то получим ссылку (скорей всего одну) на этот магазин. Теперь понял? Если нет то лучше, перечитай про inurl, так как опция архиполезная, позволяет искать любые уязвимые скрипты. ​
    Опция третья в нашем списке: intext. Опция при взломе не очень нужная, но все таки напишу: позволяет искать только в тексте игнорируя заголовок и ссылки, если еще точнее то ищет только в контейнере
    HTML:
    <body></body>
    
    Cинтаксис такой: "intext:фраза для поиска". Думаю пример излишен.​
    Опция четыре: inanchor. Позволяет искать в тексте якоря. К примеру, есть html код - <a href='http://antichat.ru/>Antichat</a>. Под воздействием команды inanchor: будет искать только Antichat - это и есть текст якоря.​
    Опция пятая по счету: site. Ограничивает поиск поддоменами указаного домена. Звучит запутано, но сейчас разъясню: К примеру нас интересует какие сайты хостятся на narod.ru. Пишем: "site:narod.ru" и получаем все сайты на народе, т.е. его домены 3 и т.д. уровней.​
    Опция нумер шесть: link. Позволяет узнать сайты, которые ссылаются на указанный. Т.е. "link:www.Antichat.ru" покажет сайты на которых есть ссылки на Antichat.ru. ​
    Седьмая опция: cache. Ищет НЕ а Интернете, а в кэше который проиндексировал Google. Т.е. если нам нужен ресурс, а он либо обвалился либо обновился, то не беда: мы можем достать его из кэша Google. Синтаксис такой: "cache:cnn.com".​
    Восьмая опция: filetype. Еще одна архиполезная команда: ищет по расширению. К примеру нам нужно найти страницу на которой есть слово администрирование и она имеет расширение php. Для этого вбиваем строку: "администрирование filetype:php". Чуешь, чем пахнет: а если вбить "filetype:pwd", то можно получить ссылки на сайты где frontпага хранит пароли на ftp коннект с сайтом и задефейсить его (подробнее о fronpage можно прочесть в frontpage.txt от RST, автор 1dt.w0lf).​
    Девятая опция related. Командует Google выдавать сходные по тематике сайты. Догадайтесь какой будет результат, если ввести "related:antichat.ru".​
    Завершает топ-десять опция index of. Если использовать “index of” в строке поиска, то найдете списки каталогов определенных папок на серверах.Пример:"«index of» admin" или "«index.of.admin»" (в кавычках кавычки нужны)покажет большой список каталогов admin папок.​
    Ну, как ты теперь относишься к поисковикам, отношение переменилось, верно, но енто ищо не все. Опции можно группировать для более хорошего результата. Например, site:mil “index of” admin покажет листинг страниц на военных сайтах mil, где есть admin директория. Весело правда?:)). Или такой inurl:admin.cfg “index of”, ищо круче, да? Но без ложки дегтя никак: не все опции работают вместе, например sitе и link вместе работать не будут категорически. Но вроде бы остальные пахают нормально. Особенно хорошо в группе действуют intitle, site, inurl, filetype. Также Google не поддерживает маски (* и ?). В поисковиках где поддерживаются маски ты можешь ввести фото* и ждать ответов типа фотография и фотомодель. В Google этот финт не пройдет, т.к. маска используется для замены слов. Ищо Google не обрабатывает запросы свыше десяти слов, обходить ограничение нужно заменив наименее значимые слова на *. ​
    Но про Google, еще не все. Ты когда нето вглядывался в URL который формирует поисковик на твой запрос? Нет? Какой ужас. Придется объяснять, разберем на примере: ​
    www.google.com/search?num=10&hl=en&q=Antichat+Cool+Team.
    num=10, говорит, что на одной странице может быть 10 результатов (можно задавать от 1 до 100, по умолчанию 10).
    hl=en, значит, что мы выбрали язык интерфейса английский, кто еще не догадался как его изменить объясняю, вместо en нужно подставить ru для смены на русский.​
    q=Antichat+Cool+team, это и есть сам запрос. К сожалению именно из адресной строки по русски писать нельзя, для этого нужно перевести данные в шеснадцатиричный вид, но для этого есть форма.
    Также мы можем подключить следующие опции поиска: ​
    as_qdr=m1 - указывает древность (возраст) найденной инфы в месяцах (от 1 до 12).​
    safe=on - включает режим safe search при котором Google как может будет фильтровать результат от информации сексуального характера aka порнухи.​
    Ну что много, все запомнили? Теперь мы рассмотрели забугорный Google от и до, посмотрим что противопоставил этому родной Яndex (yandex.ru). Скажу сразу, для меня лучше использовать Google, т.к. там лучше поиск, больше опций, а впрочем судите сами.​
    Итак, Яндекс: cистема учитывает морфолгию (или грамматику, как это там называется?), т.е. при запросе типа "словарь" ищет вариации словарь, словари, словарем и т.п. Заставить Яндекс отказаться от дурной привычки делать что не просят можно либо побеседовав с ее админом :)), либо ставя перед словом восклицательный знак(!), теперь наш запрос будет выглядеть так "!словарь". В отличие от продвинутого Google, Яндекс делает различие между регистром букв. Работает это так: если слово написано с заглавной (aka большой) буквы, то yandex выдает результат, в котором это слово встречается ТОЛЬКО с заглавной буквы. Если же слово начинается с прописной (aka мелкой) буквы, то Яндекс ищет все вариации, т.е. и с большой и с мелкой. Ставя перед словом минус(-) мы делаем так чтобы Яндекс его не выдавал в результат. Если же ставить плюс(+), то поисковик знает - это слово обязано быть в результатах. Теперь о логических элементах: как и Google Яндекс по умолчанию ищет используя логический элемент AND (и). Для того чтобы это исправить ставим |, только |, т.к. Яндекс не понимает OR. Пример можно посмотреть выше, где есть примеры для Google. Теперь опять немного об исключениях слов и символе ~ (тильда). Если перед словом поставить одиночную тильду ~, то слово будет исключено в пределах предложения, а если двойную ~~ то в пределах документа. Пример: "~словари" - исключение из предложения, а "~~словари" -исключение в пределах документа. Сходный принцип и слогическим оператором AND (и). В Яндекс обозначается &(если забыли - одиночный & используется по умолчанию). Т.е. если он одиночный, то включение слов идет только в предложение, для включения слов в документ нужно написать &&, например "Antichat&& Cool&&Team" ищет по всему документу.​
    Теперь опции: ​
    Опция первая: $title. Ищет в заголоке документа в контейнере тегов <title></title>. Синтаксис: "$title Antichat team".​
    Опция вторая: $anchor. Поиск в тексте якоря. Синтаксис: "$anchor Antichat Team"./

    Опция третья: #link. Показывает сайты которые ссылаются на указанный сайт. Синтаксис: "#link="antichat.ru*"" (обратите внимание на кавычки и *) - найдет сайты ссылающиеся на antichat.ru.​
    Опция четвертая, предпоследняя: #image. Выберет сайты на которых в атрибуте alt тега img есть указанная фраза. Синтаксис:"#image="Hackers"" (обратите внимание на кавычки) - найдет все картинки которые подписаны Hackers.​
    Опция последняя: #url. Ограничивает поиск одним сервером, как говорят усастые дяди из Яндекс. Лично я ничего полезного из нее не извлек. Синтаксис: "#url="antichat.ru"" (обратите внимание на кавычки) - должна ограничить поиск, но почему-то не пашет.​
    Ну теперь мы также разобрали Яндекс, как до этого Google. Надеюсь, я убедил вас в том, что Google намного превосходит Яндекс и вообще и для наших неблаговидных целей.
    Но осталось еще кое-что, что подходит для всех поисковых систем, которые индексируют контент тегов
    descreption и keywords. Не секрет, что разные бесплатные движки (да и платные кстати тоже) вставлют туда слова типа powered by название_продукта (сила в ...). Например powered by RunCMS. Забив такую строку в форму поиска мы найдем в частности ссылки на программные продукты, которые указали в названии_продукта. Но метод работает не со 100% гарантией, т.к. powered by подставляется не всеми движками, да и админ, который не очень ушастый, изменяет сорцы продукта. Напоследок хочу дать совет: прежде чем лезть в бой стоит внимательно обдумать каждое слово запроса, подумать о том, что присуще только "твоему" движку/скрипту и только после этого открывать поисковую систему.​
    Теперь опробуйте новые знания на практике, и вы поймете, что поисковики - зверская сила. Удачи.​
     
    #1 А®ТеS, 5 Dec 2006
    Last edited: 5 Dec 2006
    5 people like this.
  2. Digimortal

    Digimortal Banned

    Joined:
    22 Aug 2006
    Messages:
    471
    Likes Received:
    248
    Reputations:
    189
    =))
    "index of" - это, по-твоему, опция гугла?
     
  3. А®ТеS

    А®ТеS Active Member

    Joined:
    25 Nov 2006
    Messages:
    198
    Likes Received:
    193
    Reputations:
    41
    Green_Bear - как смог отредактировал.
    Digimortal - тесно связана с поиском так что можно и так считать)).
     
  4. Digimortal

    Digimortal Banned

    Joined:
    22 Aug 2006
    Messages:
    471
    Likes Received:
    248
    Reputations:
    189
    нельзя..
    ты пишешь статью про то как пользоваться поисковиком, а сам не видишь разницы между запросом и опцией запроса.. :-/
     
    #4 Digimortal, 5 Dec 2006
    Last edited: 6 Dec 2006
    1 person likes this.
  5. Barsik

    Barsik Блoxacтый

    Joined:
    16 Jan 2005
    Messages:
    267
    Likes Received:
    238
    Reputations:
    182
    Статейка довольно позновательная... Тока пожалуйста, коды делайте более светлым фоном... форум темный читать не особо удобно
     
    6 people like this.
  6. GeyDee

    GeyDee Elder - Старейшина

    Joined:
    18 Mar 2006
    Messages:
    121
    Likes Received:
    61
    Reputations:
    18
    Для ньюбесов как раз. Да и для простого народа тож пойдет. Держи +, все-таки как-никак старался)))).
     
  7. KSURi

    KSURi tnega AOLPS

    Joined:
    6 Jun 2006
    Messages:
    458
    Likes Received:
    219
    Reputations:
    357
    Гм... Идите к джонни, он целую книгу про это написал
     
  8. KPOT_f!nd

    KPOT_f!nd положенец общага

    Joined:
    25 Aug 2006
    Messages:
    1,074
    Likes Received:
    502
    Reputations:
    65
    Да нового нечего для себя не открыл! Статьи умериная!
     
    1 person likes this.
  9. .:: Camelot ::.

    Joined:
    19 Dec 2006
    Messages:
    18
    Likes Received:
    0
    Reputations:
    -8
    Тема не новая... Даже давно известная... Но для новичков пойдёт.