Шрифт каптчи ВК

Discussion in 'Социальные сети' started by PabloPicasso, 12 Feb 2010.

  1. PabloPicasso

    PabloPicasso Banned

    Joined:
    2 Jan 2010
    Messages:
    88
    Likes Received:
    32
    Reputations:
    16
    Как вы думаете какой шрифт более близкий к тому который генерится в каптче ВК?
    вот 3 ВК каптчи:
    [​IMG][​IMG][​IMG]

    мне кажется эт Times New Roman
     
    #1 PabloPicasso, 12 Feb 2010
    Last edited: 12 Feb 2010
  2. FEV

    FEV Member

    Joined:
    23 Sep 2009
    Messages:
    15
    Likes Received:
    7
    Reputations:
    0
    Убран волновой фоновый шум и произведена элементарная бинаризация изображения.
    Боюсь, что для распознавания этого не достаточно)
    Лучше попробуй решить следующие проблемы:
    1) удаление 2х пересекающих капчу линий, которые существенно мешают распознаванию
    2) сегментация символов
    А распознать уже разрезаные символы - это элементарно)
     
  3. PabloPicasso

    PabloPicasso Banned

    Joined:
    2 Jan 2010
    Messages:
    88
    Likes Received:
    32
    Reputations:
    16
    я для четкости бинаризировал, отсекание линий я нашел в одном из алгоритмов определения градиентных областей, символы у меня разделяет с 70% точностью

    я просто со шрифтом определится хочу, хотя уже не нужно, нашел оптимальный =)

    советую почитать:
    http://www.cognitive.ru/innovation/sbornic4/doc10.doc
    и здесь
    http://openocr.org/forum/viewtopic.php?f=5&t=15
     
    #3 PabloPicasso, 12 Feb 2010
    Last edited: 12 Feb 2010
  4. Whois

    Whois Banned

    Joined:
    5 May 2009
    Messages:
    0
    Likes Received:
    2
    Reputations:
    0
    отпишись если чтото получиться.... довольно актуальная тема
     
  5. P.A.U.L

    P.A.U.L New Member

    Joined:
    12 Aug 2009
    Messages:
    0
    Likes Received:
    0
    Reputations:
    0
    Сменят вид капчи, и все, трындец)
     
  6. PabloPicasso

    PabloPicasso Banned

    Joined:
    2 Jan 2010
    Messages:
    88
    Likes Received:
    32
    Reputations:
    16
    с антикапчей они нечего менаять не будут
     
  7. PabloPicasso

    PabloPicasso Banned

    Joined:
    2 Jan 2010
    Messages:
    88
    Likes Received:
    32
    Reputations:
    16
    ВК могут не волноваться, даже с полной оптимизацией капчу разбирает 30 сек и 10 распознает )))

    самая быстрая система получается при распознавании слегка очищенной каптчи полным перебором средним размером шрифта, в этом случае примерно 10% правильных ответов и 20 сек на каждую каптчу.

    с полным разбором до 60% правильных и 40 сек на шт.
     
    #7 PabloPicasso, 15 Feb 2010
    Last edited: 15 Feb 2010
  8. dvion

    dvion New Member

    Joined:
    11 Mar 2009
    Messages:
    12
    Likes Received:
    2
    Reputations:
    0
    PabloPicasso,
    40 сек - много.

    60% - мало.

    Шрифт, ближе B52 - не нашёл. Но с B52 у меня процентов 95 есть, думаю.
     
  9. actralus

    actralus Banned

    Joined:
    22 Feb 2010
    Messages:
    15
    Likes Received:
    0
    Reputations:
    0
    программистом россии жалко заплатить бакс за 1000 капч а не жалко убить всю жизнь способом распознованием xD
     
  10. Tigger

    Tigger Elder - Старейшина

    Joined:
    27 Aug 2007
    Messages:
    936
    Likes Received:
    527
    Reputations:
    204

    Это спортивный интерес.
    Видимо не понять.
     
  11. [Soulfly]

    [Soulfly] New Member

    Joined:
    11 Feb 2009
    Messages:
    0
    Likes Received:
    0
    Reputations:
    0
    Можно даже сказать - научный.
     
  12. GeraMon

    GeraMon New Member

    Joined:
    3 Sep 2009
    Messages:
    0
    Likes Received:
    1
    Reputations:
    0
    я тысячи баксов уже на эти капчи потратил так что автоматическая распознавалка окупаться будет )
     
  13. Fliplab

    Fliplab Elder - Старейшина

    Joined:
    29 Jul 2008
    Messages:
    123
    Likes Received:
    20
    Reputations:
    3
    Подскажи как отсек пересекаемые линии.
     
  14. dvion

    dvion New Member

    Joined:
    11 Mar 2009
    Messages:
    12
    Likes Received:
    2
    Reputations:
    0
    Как уже понятно, нету как бе идеального.

    У меня вот так высекается (вторичный главный фильтр, убирает основное говно и каку)

    x := InThesePixelsQa(i,j); <- стандартный пейнтовский алгоритм (забирает кусок образца и вычисляет куб MaxX, MinX, MaxY, MinY
    pe := (x*100)/(((MaxX-MinX)+1)*((MaxY-MinY))+1); процент информативности

    if ( ( x/pe ) > gMinSymbHele

    где gMinSymbHele - мнимальное, для символа, собсно, значение. у линий и всякого мусора - оно слишком низкое.

    ну где-то 0.8 - единичка.


    - но это всё при условии, что у вас заранее символы отделены от линий (работа со слоями)

    у меня сделано именно так)



    Шрифт, как оказалось, дисительна нью тайм роман)
    токо, кажись, лапаются там и другие чары - а возможно искривление высокое)

    ну, в общем, я лично матрицы не юзаю - я пользуюсь формулой: число совпавших пикселей отнять модуль разницы числа пикселей сравниваемого символа со сравнимым.

    ну чё, работает кое-как, тема интересная, можно покопаться для фана :)

    ПС кому интересно, дабы базар не лить) slil. ru /28713027
     
  15. derrekes

    derrekes New Member

    Joined:
    15 Jun 2008
    Messages:
    0
    Likes Received:
    1
    Reputations:
    0
    Поддерживаю. Предлагаю закрытый клуб борцов против капчи сделать. Кто за? Думаю те кто в теме понимают какие это расходы несмотря на низкую стоимость капчи. все инвайтеры как минимум
     
  16. dvion

    dvion New Member

    Joined:
    11 Mar 2009
    Messages:
    12
    Likes Received:
    2
    Reputations:
    0
    Кодом не поделюсь, он дорогой сильна :х ))

    Могу подсказать кому интересно интересующие вещи, так сказать - это без проблем)
     
  17. -Straniks-

    -Straniks- Member

    Joined:
    11 Aug 2009
    Messages:
    0
    Likes Received:
    6
    Reputations:
    0
    dvion, Какой процент распознания у тебя? И какая скорость разгадывания? тестил на инвайте?
     
  18. dvion

    dvion New Member

    Joined:
    11 Mar 2009
    Messages:
    12
    Likes Received:
    2
    Reputations:
    0
    Процент распознавания зависит от режима, я думаю что процентов 30-40, не более. Скорость распознавания - ~200 MS (по возможности тут ускоряю, можно значительно меньше, но либо перекатывать вообще на асму или иные компоненты).
    Пс а сразу перекатыать не вариант - так как ещё "в доработке" )

    Инвайтинг - всё норм. В инвайтинге по моим наблюдениям всё зависит от скорости ответа на капчу.

    Такие дела.
     
  19. FEV

    FEV Member

    Joined:
    23 Sep 2009
    Messages:
    15
    Likes Received:
    7
    Reputations:
    0
    Можно ставить счетчик, сколько кодерам ВК потребуется времени для того, чтоб переделать капчу)
     
  20. Vald

    Vald Member

    Joined:
    6 Aug 2009
    Messages:
    25
    Likes Received:
    16
    Reputations:
    0
    Если бы так открыто в паблике не обсуждали...