Генерация запросов

Lolinas · 30 Aug 2021

Говорят, если создать «шум» в сетевом трафике, то труднее будет отыскать впн или тор соединения. На что влияет этот «шум»? У провайдеров хранятся логи (по-разному, от 3 месяцев до 2 лет) и в автоматическом режиме они архивируются и скидываются в мусороприемник какого ни будь сервера. Допустим у провайдера 1000 клиентов и за целый день каждый сгенерирует около 1000 запросов. В итоге мы имеем миллион строк в текстовом файле (около 100МБ). На деле, и тех и этих может быть гораздо больше. Когда на этом сервере заканчивается место, очень часто удаляются самые старые файлы. Выходит, что чем больше мы запросов произведем, тем быстрее засорим жесткие диски сервера. Но мы не знаем объём хранилища. Да, возможно, провайдеры хранят их на облаках, но это единицы. Все остальные придерживаются правила – меньше вклад и больше прибыль.
На просторах интернета несколько генераторов трафика - web-traffic-generator, needl, noisy. Вот только они все написаны на питоне, и каким образом их запустить на windows не известно. Почему-то такого рода софт трудно найти, поэтому попытался своими силами что-то написать, используя скриптовый язык autoit

#include <array.au3>
#include <File.au3>
$file1 = FileOpen("word1.txt")
$file2 = FileOpen("word2.txt")
$file3 = FileOpen("word3.txt")
$file4 = FileOpen("word4.txt")
Dim $word1[1]
Dim $word2[1]
Dim $word3[1]
Dim $word4[1]
$word1_count = _FileCountLines("word1.txt")
$word2_count = _FileCountLines("word2.txt")
$word3_count = _FileCountLines("word3.txt")
$word4_count = _FileCountLines("word4.txt")
For $i = 1 To $word1_count
_ArrayAdd($word1, FileReadLine($file1, $i))
Next
For $i = 1 To $word2_count
_ArrayAdd($word2, FileReadLine($file2, $i))
Next
For $i = 1 To $word3_count
_ArrayAdd($word3, FileReadLine($file3, $i))
Next
For $i = 1 To $word4_count
_ArrayAdd($word4, FileReadLine($file4, $i))
Next
$googles_domains = FileOpen("googles_domains.txt")
$googles_domains_count = _FileCountLines("googles_domains.txt")
Dim $googles_domains_array[1]
For $i = 1 To $googles_domains_count
_ArrayAdd($googles_domains_array, FileReadLine($googles_domains, $i))
Next
$string = StringSplit("1234567890_qwertyuiopasdfghjklzxcvbnmQWERTYUIOPASDFGHJKLZXCVBNM", "")
HttpSetUserAgent("Mozilla/5.0 (Android 9; Tablet; rv:76.0) Gecko/76.0 Firefox/76.0 ")
$file = FileOpen("site.txt")
Dim $site[1]
For $i = 1 To _FileCountLines("site.txt")
_ArrayAdd($site, FileReadLine($file, $i))
Next
While True
Switch Random(1, 7, 1)
Case 1
antichat()
Case 2
xss()
Case 3
lost()
Case 4
rutracker()
Case 5
youtube()
Case 6
all_site()
Case 7
google_search()
EndSwitch
Sleep(10000)
WEnd
Func google_search()
$text1 = $word1[Random(1, $word1_count, 1)] & " " & $word2[Random(1, $word2_count, 1)] & " " & $word3[Random(1, $word3_count, 1)] & " в " & $word4[Random(1, $word4_count, 1)]
FileWriteLine($answ, $text1 & @CRLF)
InetRead($googles_domains_array[Random(1, $googles_domains_count, 1)] & "/search?q=" & $text1 & "&source=hp&sclient=gws-wiz", 2)
EndFunc ;==>google_search
Func antichat()
InetRead("https://forum.antichat.ru/threads/" & Random(1, 485000, 1) & "/", 2)
EndFunc ;==>antichat
Func xss()
InetRead("https://xss.is/threads/" & Random(1, 56000, 1) & "/", 2)
EndFunc ;==>xss
Func lost()
InetRead("https://www.lostfilm.tv/new/page_" & Random(1, 5000, 1) & "/", 2)
EndFunc ;==>lost
Func rutracker()
InetRead("https://rutracker.org/forum/viewtopic.php?t=" & Random(1, 6100000, 1), 2)
EndFunc ;==>rutracker
Func youtube()
$id=""
For $i = 1 To 11
$id &= $string[Random(1, 53, 1)]
Next
InetRead("https://youtube.com/watch?v=" & $id, 2)
EndFunc ;==>youtube
Func all_site()
InetRead("https://" & $site[Random(1, 500, 1)], 2)
EndFunc ;==>all_site
Click to expand...

Весь код не стану описывать, так как это может занять еще страниц 10, кто разбирается в программировании все быстро поймет. Опишу только основные моменты. Для примера, возьмем несколько форумов, youtube, google и пачку адресов сайтов. Всего вышло семь объектов, один из которых случайно запускается при повторении цикла.

Рассмотрим вкратце на примере lostfilm

InetRead("https://www.lostfilm.tv/new/page_" & Random(1, 5000, 1) & "/", 2)
Click to expand...

Эта строка создает запрос на страницу лостфильма, страница может быть случайная от 1 до 5000. Аналогично и для остальных форумов, только цифры другие.

Для youtube несколько сложнее. Чтобы сослаться на видео нужно ввести некий адрес из 11 символов, например, ютуби/watch?v=Dt9vh_eRTgd.

Деление посимвольно происходит в этой строке

$string = StringSplit("1234567890_qwertyuiopasdfghjklzxcvbnmQWERTYUIOPASDFGHJKLZXCVBNM", "")
Click to expand...

потом идет сборка

For $i = 1 To 11
$id &= $string[Random(1, 53, 1)]
Next
Click to expand...

Вот и получается ссылка.

InetRead("https://youtube.com/watch?v=" & $id, 2)
Click to expand...

Кстати, видео по данной ссылке может и не существовать, но страница с рекомендациями других видео загрузится.

Имеется также список сайтов (около 500), которые загружаются на своей главной странице

Теперь рассмотрим самое сложное – поиск в google. В скриптах питона, авторы использовали поиск лишь по одному слову. Что ж, попробуем взять целую фразу. Итак, начнем разбираться; имеются несколько файлов, которые строят «на лету» фразу для поиска. Для этого создадим 4 текстовых файла, в которых пропишем фразы

word1.txt – наименование товара

word2.txt – производитель

word3.txt – цель поиска

word4.txt – город

Приведу пример фразы сгенерированной для поиска – «Видеокарта Elitegroup продать в Таганрог». Ничего страшного, что такой видеокарты не существует, но google все равно выдаст ответ на этот запрос. Теперь по поводу построения кода
Подсчитывает количество строк в первом файле (аналогично для остальных)

$word1_count = _FileCountLines("word1.txt")
Click to expand...

Заполняем массив построчно из файла

For $i = 1 To $word1_count
_ArrayAdd($word1, FileReadLine($file1, $i))
Next
Click to expand...

Основная сборка случайных ячеек из 4х массивов

$text1 = $word1[Random(1, $word1_count, 1)] & " " & $word2[Random(1, $word2_count, 1)] & " " & $word3[Random(1, $word3_count, 1)] & " в " & $word4[Random(1, $word4_count, 1)]
Click to expand...

Так как у google есть очень много доменов (около 100), то добавим их в новый файл

Случайно выбираем домен из ранее созданного массива

$googles_domains_array[Random(1, $googles_domains_count, 1)]
Click to expand...

Окончательная строка поиска будет выглядеть так

InetRead($googles_domains_array[Random(1, $googles_domains_count, 1)] & "/search?q=" & $text1 & "&source=hp&sclient=gws-wiz", 2)
Click to expand...

Кстати, во время поиска всплывают много переменных – source, ei, oq, gs_lcp, sclient их тоже можно генерировать случайным образом

В общем-то генерация пошла

В основном цикле установлена пауза в 10 секунд. Можно выставить свое значение и скомпилировать программу для запуска нескольких копий одновременно. Но все делается, разумеется, на свой страх и риск. Не известно, как поведет себя провайдер, да и хосты станут блокировать ваш ip.

CyberTro1n · 30 Aug 2021

Нахуя ты этот расклад в общество льёшь? Харош. Замута тип топ. На днях о ней думал.
Тут будь осторожен...

Lolinas · 13 Sep 2021

Рассмотрим обновленный скрипт, который имеет большую внутреннюю базу и автоматический сбор ссылок

#include <array.au3>
#include <File.au3>
#include <Encoding.au3>
$product_file = FileOpen("product.txt")
$vegetables_file = FileOpen("vegetables.txt")
$manufactur_file = FileOpen("manufactur.txt")
$verb_file = FileOpen("verb.txt")
$city_file = FileOpen("city.txt")
$googles_domains = FileOpen("googles_domains.txt")
$file = FileOpen("site.txt")
$youtube_search_adjective_file = FileOpen("youtube_search_adjective.txt")
$IT_subject_file = FileOpen("IT_subject.txt")
$IT_verb_file = FileOpen("IT_verb.txt")
$IT_last_file = FileOpen("IT_last.txt")
$news_file = FileOpen("news.txt")
$mebel_subject_file = FileOpen("mebel_subject.txt")
$mebel_verb_file = FileOpen("mebel_verb.txt")
$questions_file = FileOpen("questions.txt")

$test=FileOpen("111.html",2)

Dim $product_array[1]
Dim $site[1]
Dim $vegetables_array[1]
Dim $manufactur_array[1]
Dim $verb_array[1]
Dim $city_array[1]
Dim $googles_domains_array[1]
Dim $youtube_search_adjective_array[1]
Dim $IT_subject_array[1]
Dim $IT_verb_array[1]
Dim $IT_last_array[1]
Dim $news_array[1]
Dim $questions_array[1]
Dim $mebel_subject_array[1]
Dim $mebel_verb_array[1]

$youtube_search_adjective_count = _FileCountLines("youtube_search_adjective.txt")
$product_count = _FileCountLines("product.txt")
$vegetables_count = _FileCountLines("vegetables.txt")
$manufactur_count = _FileCountLines("manufactur.txt")
$verb_count = _FileCountLines("verb.txt")
$city_count = _FileCountLines("city.txt")
$googles_domains_count = _FileCountLines("googles_domains.txt")
$IT_subject_count = _FileCountLines("IT_subject.txt")
$IT_verb_count = _FileCountLines("IT_verb.txt")
$IT_last_count = _FileCountLines("IT_last.txt")
$news_count = _FileCountLines("news.txt")
$questions_count = _FileCountLines("questions.txt")
$mebel_subject_count = _FileCountLines("mebel_subject.txt")
$mebel_verb_count = _FileCountLines("mebel_verb.txt")

For $i = 1 To $youtube_search_adjective_count
_ArrayAdd($youtube_search_adjective_array, FileReadLine($youtube_search_adjective_file, $i))
Next
For $i = 1 To $vegetables_count
_ArrayAdd($vegetables_array, FileReadLine($vegetables_file, $i))
Next
For $i = 1 To $product_count
_ArrayAdd($product_array, FileReadLine($product_file, $i))
Next
For $i = 1 To $manufactur_count
_ArrayAdd($manufactur_array, FileReadLine($manufactur_file, $i))
Next
For $i = 1 To $verb_count
_ArrayAdd($verb_array, FileReadLine($verb_file, $i))
Next
For $i = 1 To $city_count
_ArrayAdd($city_array, FileReadLine($city_file, $i))
Next
For $i = 1 To _FileCountLines("site.txt")
_ArrayAdd($site, FileReadLine($file, $i))
Next
For $i = 1 To $googles_domains_count
_ArrayAdd($googles_domains_array, FileReadLine($googles_domains, $i))
Next
For $i = 1 To $IT_subject_count
_ArrayAdd($IT_subject_array, FileReadLine($IT_subject_file, $i))
Next
For $i = 1 To $IT_verb_count
_ArrayAdd($IT_verb_array, FileReadLine($IT_verb_file, $i))
Next
For $i = 1 To $IT_last_count
_ArrayAdd($IT_last_array, FileReadLine($IT_last_file, $i))
Next
For $i = 1 To $news_count
_ArrayAdd($news_array, FileReadLine($news_file, $i))
Next
For $i = 1 To $questions_count
_ArrayAdd($questions_array, FileReadLine($questions_file, $i))
Next

Global $last_query
$string = StringSplit("1234567890_qwertyuiopasdfghjklzxcvbnmQWERTYUIOPASDFGHJKLZXCVBNM", "")
$string1 = StringSplit("1234567890qwertyuiopasdfghjklzxcvbnmQWERTYUIOPASDFGHJKLZXCVBNM", "")
HttpSetUserAgent("Mozilla/5.0 (Android 9; Tablet; rv:76.0) Gecko/76.0 Firefox/76.0 ")

While True
;~ _youtube_search()
;~ ExitLoop
;~ MsgBox(64,"",rand_gen_search_txt())
Switch Random(1, 12, 1)
Case 1
_antichat()
_auto(2, random(200,500,1), $last_query)
Case 2
_xss()
_auto(2, random(200,500,1), $last_query)
Case 3
_lost()
_auto(2, random(200,500,1), $last_query)
Case 4
_rutracker()
_auto(2, random(200,500,1), $last_query)
Case 5
_youtube()
_auto(2, random(50,100,1), $last_query)
Case 6
_all_site()
_auto(2, random(200,500,1), $last_query)
Case 7
_google_search()
_auto(2, random(200,500,1), $last_query)
Case 8
_yahoo()
_auto(2, random(200,500,1), $last_query)
Case 9
_baidu()
_auto(2, random(200,500,1), $last_query)
case 10
_bing()
_auto(2, random(200,500,1), $last_query)
case 11
_youtube_search()
_auto(2, random(20,40,1), $last_query)
case 12
_news()
_auto(2, random(200,500,1), $last_query)
EndSwitch
Sleep(2000)
WEnd

Func _antichat()
$last_query=InetRead("https://forum.antichat.ru/threads/" & Random(1, 485000, 1) & "/", 2)
$last_query=_Encoding_UTF8ToANSI(BinaryToString($last_query))
return $last_query
EndFunc ;==>antichat

Func _xss()
$last_query=InetRead("https://xss.is/threads/" & Random(1, 56000, 1) & "/", 2)
$last_query=_Encoding_UTF8ToANSI(BinaryToString($last_query))
return $last_query
EndFunc ;==>xss

Func _lost()
$last_query=InetRead("https://www.lostfilm.tv/new/page_" & Random(1, 5000, 1) & "/", 2)
$last_query=_Encoding_UTF8ToANSI(BinaryToString($last_query))
Return $last_query
EndFunc ;==>lost

Func _rutracker()
$last_query=InetRead("https://rutracker.org/forum/viewtopic.php?t=" & Random(1, 6100000, 1), 2)
$last_query=_Encoding_UTF8ToANSI(BinaryToString($last_query))
return $last_query
EndFunc ;==>rutracker

Func _youtube()
$id=""
For $i = 1 To 11
$id &= $string[Random(1, 53, 1)]
Next
$last_query=InetRead("https://youtube.com/watch?v=" & $id, 2)
$last_query=_Encoding_UTF8ToANSI(BinaryToString($last_query))
return $last_query
EndFunc ;==>youtube

func _news()
$last_query=InetRead($news_array[Random(1, $news_count, 1)], 2)
;~ ConsoleWrite($news_array[Random(1, $news_count, 1)]&@CRLF)
$last_query=_Encoding_UTF8ToANSI(BinaryToString($last_query))
return $last_query
EndFunc

Func _youtube_search()
$youtube_search_text = _Encoding_URLToHex($youtube_search_adjective_array[Random(1, $youtube_search_adjective_count, 1)]) & "+" & _Encoding_URLToHex("кот")
;~ ConsoleWrite($youtube_search_text)
$last_query=InetRead("https://www.youtube.com/results?search_query=" & $youtube_search_text ,2)
;~ FileWrite($test,_Encoding_UTF8ToANSI(BinaryToString($aaa)))
return $last_query
EndFunc

Func _all_site()
$last_query=InetRead("https://" & $site[Random(1, 500, 1)], 2)
$last_query=_Encoding_UTF8ToANSI(BinaryToString($last_query))
return $last_query
EndFunc ;==>all_site

Func _rand_gen_search_txt()
Local $verb_array_cell, $vegetables_array_cell, $city_array_cell
Dim $array_comb[0]
Switch Random(1, 4, 1)
Case 1 ;овощи фрукты ягода \ купить \ город
_arrayadd($array_comb,$verb_array[Random(1, $verb_count, 1)])
_arrayadd($array_comb,$vegetables_array[Random(1, $vegetables_count, 1)])
_arrayadd($array_comb,$city_array[Random(1, $city_count, 1)])
;~ _ArrayDisplay($array_comb)
$array_comb=_ArrayPermute($array_comb," ")
;~ _ArrayDisplay($array_comb)
Return(_Encoding_URLToHex($array_comb[random(1,6,1)]))
case 2 ; комп комплект \ продам \ город
_arrayadd($array_comb,$verb_array[Random(1, $verb_count, 1)])
_arrayadd($array_comb,$manufactur_array[Random(1, $manufactur_count, 1)])
_arrayadd($array_comb,$city_array[Random(1, $city_count, 1)])
_arrayadd($array_comb,$product_array[Random(1, $product_count, 1)])
$array_comb=_ArrayPermute($array_comb," ")
;~ _ArrayDisplay($array_comb)
Return(_Encoding_URLToHex($array_comb[random(1,24,1)]))
case 3 ; устанавить виндовс на флешку
_arrayadd($array_comb, $IT_subject_array[Random(1, $IT_subject_count, 1)])
_arrayadd($array_comb,$IT_verb_array[Random(1, $IT_verb_count, 1)])
_arrayadd($array_comb,$IT_last_array[Random(1, $IT_last_count, 1)])
$array_comb=_ArrayPermute($array_comb," ")
;~ _ArrayDisplay($array_comb)
Return(_Encoding_URLToHex($array_comb[random(1,6,1)]))
case 4 ;~ вопросы из ;~questions.txt
_arrayadd($array_comb, $questions_array[Random(1, $questions_count, 1)])
;~ _ArrayDisplay($array_comb)
Return(_Encoding_URLToHex($array_comb[0]))
EndSwitch
EndFunc

; ================ПОИСКОВЫЕ СИСТЕМЫ==================
;~ func _ask()
;~ $aaa=InetRead("https://www.ask.com/web?q=" & _rand_gen_search_txt()& "&ad=dirN&qo=homepageSearchBox",2)
;~ FileWrite($test,_Encoding_UTF8ToANSI(BinaryToString($aaa)))
;~ EndFunc
Func _yahoo()
$_ylt=""
For $i = 1 To 18
$_ylt &= $string1[Random(1, 52, 1)]
Next
$_ylc=""
For $i = 1 To 272
$_ylt &= $string1[Random(1, 52, 1)]
Next
$last_query=InetRead("https://search.yahoo.com/yhs/search;_ylt=AwrIS." & $_ylt & ";_ylc=" & "-?p=" & _rand_gen_search_txt() & "&fr2=sb-top&hspart=mozilla&hsimp=yhs-002",2)
$last_query=_Encoding_UTF8ToANSI(BinaryToString($last_query))
return $last_query
EndFunc

Func _baidu()
$oq = ""
For $i = 1 To 7
$oq &= $string1[Random(1, 52, 1)]
Next
$rsv_pq= ""
For $i = 1 To 16
$rsv_pq &= StringLower($string1[Random(1, 52, 1)])
Next
$rsv_t=""
For $i = 1 To 54
$rsv_t &= $string1[Random(1, 52, 1)]
Next
$last_query=InetRead("https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=" & _rand_gen_search_txt() & "&oq=" & $oq & "&rsv_pq=" & $rsv_pq & "&rsv_t=1ea2P%2F" & $rsv_t & "&rqlang=cn&rsv_dl=tb&rsv_enter=1&rsv_btype=t&inputT=" & random(1659,1610,1) & "&rsv_sug3=16&rsv_sug1=2&rsv_sug7=000&rsv_sug2=0&rsv_sug4=" & random(2800,2840,1) & "&rsv_sug=1",2)
$last_query=_Encoding_UTF8ToANSI(BinaryToString($last_query))
return $last_query
EndFunc

Func _bing()
$cvid=""
For $i = 1 To 32
$cvid &= $string1[Random(1, 52, 1)]
Next
$last_query=InetRead("https://www.bing.com/search?q=" & _rand_gen_search_txt()& "&qs=n&form=QBRE&sp=-1&pq=&sc=0-0&sk=&cvid=" & StringUpper($cvid) ,2)
$last_query=_Encoding_UTF8ToANSI(BinaryToString($last_query))
return $last_query
endfunc

Func _google_search()
$ei=""
For $i = 1 To 22
$ei &= $string1[Random(1, 52, 1)]
Next
$gs_lcp=""
For $i = 1 To 168
$gs_lcp &= $string1[Random(1, 52, 1)]
Next
$ved=""
For $i = 1 To 41
$ved &= $string1[Random(1, 52, 1)]
Next
$last_query=InetRead($googles_domains_array[Random(1, $googles_domains_count, 1)] & "/search?q=" & _rand_gen_search_txt() & "&source=hp&ei=" & $ei & "&sclient=gws-wiz&gs_lcp=" & $gs_lcp & "&ved=" & $ved & "&uact=" & random(1,9,1), 2)
$last_query=_Encoding_UTF8ToANSI(BinaryToString($last_query))
;~ FileWrite($test,_Encoding_UTF8ToANSI(BinaryToString($last_query)))
return $last_query
EndFunc ;==>google_search
; ================ПОИСКОВЫЕ СИСТЕМЫ==================

func _auto($deep, $many_link, $input_string,$save)
Local $loop=1
Local $count_number
while true
dim $second_array[1]
dim $first_array[1]
$new_=""
$first_array=_ArrayUnique(StringRegExp($input_string , '(*UCP)(?si)(https?://[\w.:]+/?[\w/?&:,=.~;@–\-+!*_#%()]*)', 3))
if IsArray($first_array)=0 then exitloop
For $j=1 to UBound($first_array)-1
if StringInStr($first_array[$j], "baidu") = 0 and _
StringInStr($first_array[$j], "schema.org") = 0 and _
StringInStr($first_array[$j], "yandex") = 0 and _
StringInStr($first_array[$j], "microsoft") = 0 and _
StringInStr($first_array[$j], "vk.com") = 0 and _
StringInStr($first_array[$j], "w3.org") = 0 and _
StringInStr($first_array[$j], "ytimg1") = 0 and _
StringInStr($first_array[$j], "youtube1") = 0 and _
StringInStr($first_array[$j], "google",2) = 0 and _
StringInStr($first_array[$j], "gstatic",2)=0 then _
_ArrayAdd($second_array,$first_array[$j])
Next
ReDim $first_array[1]
$first_array=$second_array
if UBound($first_array)<8 or StringLen($input_string )<8000 then exitloop
if UBound($first_array) <= $many_link then
$count_number = UBound($first_array)-1
Else
$count_number = $many_link
EndIf
ConsoleWrite(UBound($first_array)&" "&$count_number&" loop "&$loop&@CRLF)
$input_string=""
for $i=1 to $count_number
$new = InetRead($first_array[Random(1,UBound($first_array)-1,1)],2)
if stringlen($new) > 3000 and stringlen($new) < 1000000 then $input_string &= _
_Encoding_UTF8ToANSI(BinaryToString( $new))
next
$loop +=1
if $loop > $deep then ExitLoop
wend
endfunc
Click to expand...

Отличием нового скрипта от прошлого является упорядоченность. Функция _rand_gen_search_txt() имеет четыре решения, которые случайным образом составляются из текстовых файлов. Первая покупка или продажа овощей в городе. Рассмотрим на примере овощей. Есть файл со списком всех фруктов, овощей, ягод, плодов и случайно оттуда выбирается одно название, например, «смородина». Также из другого списка с глаголами выбирается одно слово, пусть будет «приобрести». Теперь из громадного списка городов выбирается один – Хуст. И генерируется строка по шаблону – товар + глагол + город. Применяется комбинаторика, дабы менялись слова местами и получаем массив с шестью возможными комбинациями. Из которых также случайно выбирается одна строка, которая и будет конечным ответом в этой функции

Компьютерные комплектующие покупка\продажа в городе. Аналогичным способом проделываем для комплектующих

Типичные компьютерные вопросы с операционной системой

И вопросы на общую тематику (около 850 вопросов)

Чтобы проверить что мы там ищем, можно записать информацию в файл FileWrite($test,$last_query), и потом просто открыть в браузере

Для поисковиков, типа Google существуют множество идентификаторов, которые не понятно, что означают, как генерируются, но суть одна, они идентифицируют каждый запрос с определённым ip и браузером. Для google используются эти source, sclient, ei, gs_lcp, ved, uact. Что же, узнаем сколько символом они могут быть, и какие именно символы используются и генерируем их каждый раз при запросе.

Теперь рассмотрим функцию _auto(). Изначально, она создана для ленивого пользователя (то есть меня), который не желает создавать текстовые файлы, заполнять их текстом, писать код для генерации всех слов. Суть этой функции простой – ходить по страницам и сохранять все ссылки, потом ходить по всем сохраненным ссылкам и снова сохранять и т.д. Например, мы ввели в google поисковую фразу, и нам отобразилась страница и множеством ссылками. Программа открывает каждую из этих ссылок и на открытых страницах имеем еще ссылки. Если поставить скрипт на ночь, то к утру будет обвал программы из-за нехватки ОЗУ. В первый раз программа насчитала 1636 ссылок, после того, как скрипт посетил все 1636 страниц и считал оттуда все ссылки, их стало 46619 (около 50мин на сбор). Кстати, очевидным будет то, что ссылки могут повторятся, но функция _ArrayUnique удаляет повторы, поэтому эти числа говорят про ~46тысяч не повторяющихся страниц. Если запустить третий круг сбора, то там выйдет, наверное, миллион

Поэтому совместим функцию автоматического сбора с остальными функциями с некоторыми ограничениями. Рассмотрим функцию поподробнее

_auto($deep, $many_link, $input_string)
Click to expand...

$deep – количество циклов сбора ссылок (предыдущая картинка)
$many_link – количество ссылок, используемых для перехода. Так как ссылок может быть очень много, то можно воспользоваться ограничителем
$input_string – информация, полученная из интернета с помощью функции inetread (например, страница поиска google, что на картинке взята оттуда)

Теперь рассмотрим сам код

while true
...
wend
Click to expand...

Цикл, который повторяет всю функцию определенное количество раз, то есть это глубина

$first_array=_ArrayUnique(StringRegExp($input_string , '(*UCP)(?si)(https?://[\w.:]+/?[\w/?&:,=.~;@–\-+!*_#%()]*)', 3))
Click to expand...

Здесь мы из полученной информации из интернета вытаскиваем ссылки и сразу же фильтруем на повторы

if IsArray($first_array)=0 then exitloop
Click to expand...

Если не удалось найти не одной ссылки, то цикл прекращается

For $j=1 to UBound($first_array)-1
if StringInStr($first_array[$j], "baidu") = 0 and _
StringInStr($first_array[$j], "schema.org") = 0 and _
StringInStr($first_array[$j], "yandex") = 0 and _
StringInStr($first_array[$j], "microsoft") = 0 and _
StringInStr($first_array[$j], "vk.com") = 0 and _
StringInStr($first_array[$j], "w3.org") = 0 and _
StringInStr($first_array[$j], "ytimg1") = 0 and _
StringInStr($first_array[$j], "youtube1") = 0 and _
StringInStr($first_array[$j], "google",2) = 0 and _
StringInStr($first_array[$j], "gstatic",2)=0 then _
_ArrayAdd($second_array,$first_array[$j])
Next
Click to expand...

Выбираем те ссылки, в которых не встречаются слова yandex, vk, google и т.д. Дабы скрипт не зацикливался на одном только сайте

if UBound($first_array)<8 or StringLen($input_string )<8000 then exitloop
Click to expand...

Если ссылок меньше восьми или входящая информация меньше восьми килобайт (например, картинка или страница с ошибкой доступа или 404) то цикл завершается

if UBound($first_array) <= $many_link then
$count_number = UBound($first_array)-1
Else
$count_number = $many_link
EndIf
Click to expand...

Здесь решается задача в выборе количества ссылок

for $i=1 to $count_number
$new = InetRead($first_array[Random(1,UBound($first_array)-1,1)],2)
if stringlen($new) > 3000 and stringlen($new) < 1000000 then $input_string &= _Encoding_UTF8ToANSI(BinaryToString( $new))
next
Click to expand...

Основной цикл, который собственно и спамит. Условие ниже означает то, что переменная $input_string присваивает только те ответы, которые длиннее 3000 символом и меньше миллиона

$loop +=1
if $loop > $deep then ExitLoop
Click to expand...

Счетчик, если порядковый номер цикла будет больше чем глубина сбора, то цикл прекращает работу

Посмотрим, что покажет yogadns за неделю тестирования скрипта

Lolinas · 20 Oct 2021

Ну вот дошли руки и до сборки всех текстовых файлов в единый. Достаточно запустить и процесс пойдет. Для удобства был создан файл конфигурации в котором есть некоторые настройки. Можно менять ua и включать гуи интерфейс, а вот глубину и пределы для генерации случайных цифр лучше не трогать. Если программа будет запущена на виртуальной машине, то следует выделить достаточное количество озу (~4гб) и не использовать динамическую память. Так как файл может загрузиться очень быстро (ну зависит от скорости интернета) и память просто не успеет выделить и получим ошибку об нехватки памяти.

Наверное, самый распространенный вопрос, а как будет относится провайдер к этому? Никак, провайдеру важно количество занятых портов на сервере. Мы все сидим за натом. Допустим, самая обычная сетка класса ц, к свитчу подключено 250 пользователей. Каждый из них держит открытым 100 соединений, в итоге на свитче 25к открытых портов, а это уже чуть меньше половины допустимых. Это актуально является для раздатчиков торентов. Посмотрите, сколько соединений открыто при раздаче пару десятков торентов, а тут еще какой-то юзер включи спам программу. Поэтому не стоит злоупотреблять и запускать много копий программы одновременно. Даже если это случится, то в большинстве случаев провайдер позвонит клиенту и скажет "ай-я-яй".

Почему я написал эту программу, ведь есть аналоги? Да, есть, но они не работают на винде и имеют унылый функционал. А тут функция автоматического поиска ссылок на страницах и переход по ним в дальнейшем.
https://mega.nz/file/0CAhUQYS#C7Y8tFM3hdnAibOQS6SyQNfgk_W0t-WquEFcstreli4

Lolinas · 25 Jul 2022

Cсылка. Немного дополнил программу. Добавлены ua, можно даже дописывать их в конце ини файла, просто пишем 33=новый ua. Ua случайно выбирается из этого списка при каждом запросе.

Также добавлена информация в сплывающей подсказке

Тут три строки. В первой указано общее количество запросов и размер скачанных данных. Во второй указана поисковая фраза и какой поисковик использовался. В третьей указано круг: номер текущей ссылки этого круга / всего ссылок на этом кругу, затем сама текущая ссылка. Часть ссылки может быть невидна, это все из-за того, что windows ограничивает всплывающую подсказку 128 символами.

Генерация запросов

Lolinas Member

CyberTro1n Well-Known Member

Lolinas Member

Lolinas Member

Lolinas Member

Useful Searches

Генерация запросов

Lolinas Member

CyberTro1n Well-Known Member

Lolinas Member

Lolinas Member

Lolinas Member