Парсинг куков сайта

Discussion in 'PHP' started by byXrom, 12 Oct 2019.

  1. byXrom

    byXrom New Member

    Joined:
    12 Oct 2019
    Messages:
    1
    Likes Received:
    0
    Reputations:
    0
    Есть сайт который я парсил php+crurl'ом, с авторизацией, но он недавно ввел запрет на отображения сайта без js.

    Проверяет он наличие js (исходя сугубо из своих тестов) через генерацию определенных кук и данных формы (при авторизации)

    вопрос, какие есть варианты создания авторизации для такого сайта? Конечно можно полностью разобрать все js скрипты, изучить что и как генерируется, но я никогда не имел опыта с js, для меня это темный лес(

    Возможно ли как то прогружать сайт во фрейме, авторизироваться вручную и парсить куки? Для уже дальнейшего использования с курлом.

    Спасибо за внимание!! Буду рад любому предложению/совету!
     
  2. mail156

    mail156 Banned

    Joined:
    28 Sep 2018
    Messages:
    464
    Likes Received:
    357
    Reputations:
    0
    Вот этот софт https://forum.antichat.ru/threads/470867/ сохраняет cookies в файл, может быть их и можно сохранять в txt файл, а потом php или c/c++ софтом подставлять в curl код...Не знаю.
     
  3. pas9x

    pas9x Elder - Старейшина

    Joined:
    13 Oct 2012
    Messages:
    423
    Likes Received:
    585
    Reputations:
    52
    Именно это и нужно сделать. Других вариантов нет.
    Изучаешь как яваскрипт сайта генерит куку и делаешь в своём пхп-скрипте такую-же генерацию. Если там рекапча то это будет уже геморчик :)
    Сначала тебе надо найти название куки которая разрешает зайти на сайт. Затем во всех js-файлах ищи её название — рядом с ним будет и код который её генерирует.

    Кстати, чтобы у админа не возникло желания делать защиту не нужно насиловать его сайт. Если там какой-нибудь вордпресс то ты можешь вынести его даже с 3 потоков. Лучше парсить в 1 поток, хоть это и займёт больше времени но зато это не будет особо напрягать админа. Может у него сайт еле шевелится из-за тебя и ты не даёшь ему выбора кроме как защищаться от ботов.
     
    #3 pas9x, 16 Oct 2019
    Last edited: 16 Oct 2019
    mail156 likes this.