Парсинг сайта браузерной игры

Discussion in 'PHP' started by Tisar, 4 Feb 2010.

  1. Tisar

    Tisar New Member

    Joined:
    12 Sep 2009
    Messages:
    18
    Likes Received:
    0
    Reputations:
    0
    Некоторое время назад играл в браузерку Ботва-Online, так вот, там было большой проблемой поиск противника в соответствии со своим лвлом и статами. Нашёл сайт (написаный на JavaScript) который осуществляет подобный поиск, но при поиске приходилось долго ждать результата т.к. парсинг и проверка соответствия требуемым параметрам производилась на стороне пользователя. Некоторое назад сайт загнулся, а автор не планирует его в дальнейшем обслуживать.

    Хочу попробовать создать подобный сайт, но с гораздо более гибкими возможностями поиска и мгновенным выводом результата (поиск будет производиться в заранее созданной БД с характеристиками всех игроков). Вот тут и подстерегает главная проблема. По данным разработчиков браузерной игры всего было выполнено 1,5 милиона регистраций новых персонажей. БД желательно обновлять раз в 3-7 дней т.е. за час нужно производить парсинг ~ 9 000 страниц (10-15 Кбайт). (не беру в расчёт, что в будущем можно будет обновлять так часто только реально играющих игроков, а остальных ещё реже)

    Внимание вопрос:
    1) Бред или не бред, а вполне реализуемо?
    2) Не забанит ли хостер за подобные дела? :mad:
    3) ваши мысли по возможности реализации.
    4)
     
  2. apolon47

    apolon47 Banned

    Joined:
    13 Apr 2009
    Messages:
    119
    Likes Received:
    14
    Reputations:
    4
    Вполне реализуемо
    Не должен
    Трафика правда многа
     
  3. mr.The

    mr.The Elder - Старейшина

    Joined:
    30 Apr 2007
    Messages:
    1,080
    Likes Received:
    456
    Reputations:
    38
    1) реализуемо
    2) купи вдс\впс
    3) preg_math твой друг
     
  4. Tisar

    Tisar New Member

    Joined:
    12 Sep 2009
    Messages:
    18
    Likes Received:
    0
    Reputations:
    0
    Вначале планируется доход только от рекламы на сайте и в этом случае мало вероятно что окупятся расходы на VPS / VDS сервер (700-900 руб./месяц).
    1) Мб кто нибудь знает хостинги, где к парсингу боле мене закрывают глаза? (некоторые люди меня быстренько отправят в Google, хотелось бы услышать мнения людей пользовавшихся или слышавшие о таких хостерах)
    2) как я понял если используешь VPS / VDS сервер, то провайдер без разнице чем ты на нём занимаешься? Хоть для рассылки спама используй данный сервер?

    Набросал часть скрипта для парсинга и получилось что для его реализации мне требуется: CURL, tidy (для исправления полученной страници) и т.к. не очень пока дружу с регулярными выражениями, то для парсинга использую DOM.
     
    #4 Tisar, 5 Feb 2010
    Last edited: 5 Feb 2010
  5. Tisar

    Tisar New Member

    Joined:
    12 Sep 2009
    Messages:
    18
    Likes Received:
    0
    Reputations:
    0
    В общем вопрос остался тот же, но с некоторыми дополнениями:

    Вначале планируется доход только от рекламы на сайте и в этом случае мало вероятно что окупятся расходы на VPS / VDS сервер (700-900 руб./месяц).
    1) Мб кто нибудь знает платные хостинги (как я понял искать бесплатный хостинг с поддержкой Curl бесполезное занятие), где на парсинг боле мене закрывают глаза? (парсить сайт буду через прокси, иначе думаю админы ресурса который будут парсить быстро спалят меня) (некоторые люди меня быстренько отправят в Google, хотелось бы услышать мнения людей пользовавшихся или слышавшие о таких хостерах)
    2) как я понял если используешь VPS / VDS сервер, то провайдер без разнице чем ты на нём занимаешься? Хоть для рассылки спама используй данный сервер?

    Переписал весь скрипт парсера (Парсить теперь буду регулярными выражениями. В итоге вышло надёжнее и удобнеею) и теперь для его работы мне требуется только Curl.
     
  6. Solker

    Solker Elder - Старейшина

    Joined:
    4 May 2006
    Messages:
    175
    Likes Received:
    53
    Reputations:
    18
    Можно и без Curl'a, fsockopen. Зачем тебе VDS? Найди старый комп, купи за 300 рублей у соседа. Накатай на него Debian (не Debian). Повесь апач и веб сервер.
    Теперь у тебя есть тестовая платформа для тестирования твоего мега-парсера (4 регулки?). Твой парсер - это один скрипт. Который просто по циклу прогоняет все страницы пользователей и собирает данные, создает md5, сравнивает с тем, что в базе. Если изменился - то записывает новые.
    Запускаешь скрипт в работе 24ч с промежутком между циклами 30секунд например, чтоб наверника. И после завержения он снова вызывает сам себя.
    Спустя пару дней смотришь базу, пробуешь писать обработчик всего этого.

    И если случилось чудо и ты написал обработчик (и он даже работает). То беги и оплачивай свой VDS (который тебе нахрен нужен).
     
  7. QtQDuck

    QtQDuck Member

    Joined:
    1 Aug 2007
    Messages:
    70
    Likes Received:
    10
    Reputations:
    0
    Был БОТ, который работает именно с парсингом. Причем конкретно для Ботвы... Не знаю как сейчас, но пол года назад,может год, такой бот был.
    Так что ДА, реализуемо.
    1) Ищи дешевый хостинг. Они даже и не проверяют(или просто закрывают глаза)...по крайней мере у меня именно так.
    2) Использую VPS\VDS сервер, за 3 месяца никаких претензий ко мне не было.
     
    #7 QtQDuck, 16 Feb 2010
    Last edited: 16 Feb 2010
  8. Tisar

    Tisar New Member

    Joined:
    12 Sep 2009
    Messages:
    18
    Likes Received:
    0
    Reputations:
    0
    Почему ваш ответ настолько скептический? Вы сразу родились "крутым" программист не когда не учились, не спрашивали у людей как лучше поступить? В БД у меня парсится 21 параметр. Обработчик просто выводит данные на страницу в соответствии с некоторыми условиями, всё эти условия задаются в MySQL запросе.
     
  9. Solker

    Solker Elder - Старейшина

    Joined:
    4 May 2006
    Messages:
    175
    Likes Received:
    53
    Reputations:
    18
    Я просто хочу сэкономить ваши деньги.
    Сначала надо что-то сделать а потом уже бежать и оплачивать сервер, а не наоборот.
     
  10. b3

    b3 Banned

    Joined:
    5 Dec 2004
    Messages:
    2,170
    Likes Received:
    1,155
    Reputations:
    202
    Бред, ктото воспользуется твоим поиском, нападет на противника, а статы противника парсились не только что а к примеру 25 минут назад, и противник получил ЛВЛап и прокачал статы на все бабки, и он тебя разрывает в сухую.

    ЗЫ Игра понравилась, я даже бота написал накручивающего бабки за приглашения прокси ботов, сейчас пишу бота для файтинга каждые 15 минут.
     
  11. [ DSU ]

    [ DSU ] Elder - Старейшина

    Joined:
    22 Oct 2007
    Messages:
    103
    Likes Received:
    96
    Reputations:
    88
    А вы всё онанируете...
    Если хочеш парсить со своей бд, то тебе надо не большой ботнет, или можно просто в игре (хз как там я не играю) на всех локациях ботов по оставлять и при запросе юзера циклом пройтись по ботам видит ли его кто нить...
    И еще неужели разработчик не предоставляет АПИ?
     
  12. Tisar

    Tisar New Member

    Joined:
    12 Sep 2009
    Messages:
    18
    Likes Received:
    0
    Reputations:
    0
    Я так и поступаю. Нужно сначала обдумать где и откуда и какие там у меня будут возможность парсить, а уже потом более детально дорабатывать написанный скрипт.

    За пол часа игрок не сможет повысить свои статы настолько существенно, что его уже нельзя будет победить. Ищущий надеюсь тоже будет не дурак, чтобы подбирать себе противника в притирку к своим статам. Спустя некоторое время работы сайта можно будет выделить постоянно играющих игроков и парсить их статы гораздо чаще.

    О чём вы вообще? Какой ботнет? Все требуемые мне данные доступны в открытом доступе т.е. регистрироваться в игре мне для этого ненужно.
     
  13. b3

    b3 Banned

    Joined:
    5 Dec 2004
    Messages:
    2,170
    Likes Received:
    1,155
    Reputations:
    202
    Давай представим ситуацию, ты парсиш по быдло сервису который обновляется как сказал ТС каждые 7-9 часов, ты нашел меня, у меня статы: 2й лвл, и все параметры по 5-7, ты нападаеш нам меня и тут ХУЯК а у меня 2к золота в пол часа капает через приглашения друзей по реф ссылке, и статы у меня не 5-7 а 15-20 и ты начинаеш у меня брать за обе щеки, клёвый сервис ?
    Как вам еще обьяснить незнаю, толи настолько глупые, толи элементарных вещей не понимаете.
     
  14. Tisar

    Tisar New Member

    Joined:
    12 Sep 2009
    Messages:
    18
    Likes Received:
    0
    Reputations:
    0
    За пол часа игрок не сможет повысить свои статы настолько существенно, что его уже нельзя будет победить. Ищущий надеюсь тоже будет не дурак, чтобы подбирать себе противника в притирку к своим статам.
    Как вариант результат (3-5 персов) поиска можно обновлять, с сервера Ботвы перед выводом пользователю и выводить уже 100% верный результат.
    + БД также будет обновляться.
    - пользователю придётся дольше ждать результат запроса. добавится время на парсинг.


    Назрел один немало важный вопрос к участникам форума:
    Может ли и на каком основание, администрация Ботвы-Online написать заявление хостеру для прекращения работы данного сайта-поисковика? Например, т.к. мой сайт использует не пренадлежащие ему данные, и предоставляет их в пользование другим и т.д..
     
  15. b3

    b3 Banned

    Joined:
    5 Dec 2004
    Messages:
    2,170
    Likes Received:
    1,155
    Reputations:
    202
    http://g1.botva.mail.ru/page.php?page=rules
     
  16. Tisar

    Tisar New Member

    Joined:
    12 Sep 2009
    Messages:
    18
    Likes Received:
    0
    Reputations:
    0
    Что-то я не понял, а какое отношение это имеет ко мне?
    Эти правил имеют отношение только к игрокам зарегистрированных и играющим на их сервере. Меня же интересует может ли администрация Ботвы-Online каким нибудь образом закрыть мой будущий сайт-поисковик??