Прочитал пару книг по СИ начального уровня. описание стандартной библиотеки и тд. Хочу развиваться дальше но не могу найти литературу с дальнейшими инструкциями. Хотел бы почитать про разные библиотеки а так же про компилирование исходников которые не состоят из одного файла в 20 строк кода. Написал банальный парсер на курле и тот скомпилировать не смог без сторонней помощи. В начальных книгах не пишут как линковать библиотеки, банального #include <curl.h> не хватило, пришлось компилятору параметр -lcurl давать. Подскажите что нибудь более углубленное.
Спасибо, ни одна книга не подходит. Меня не интересует Си шарп или плюсы. Меня интересует чистый СИ под Линукс.
-lcurl... Тебе не книги надо читать, а мануалы по gcc. А сторонние библиотеки ищутся и изучаются, когда в них возникает необходимость. Решил написать что-то с OpenGL - ищешь либы для работы с OpenGL, ну и так далее...
Ну так и делаю пока-что. Еще вопрос, можете показать пример кода парсера ссылок по регуляркам, имеется страничка (любая html) задача отпарсить ВСЕ ссылки на странице, мой код парсит только первую попавшуюся ссылку получается как preg_match а нужен preg_match_all ето если сравнивать с php
__ttp://www.proklondike.com/books/linux/page/1.html там есть пара тройка хороших книг по кодингу под линь по моему эту задачу проще решить sed'ом
В школе особенно успеваю. Каким образом sed относиться к СИ? Только не предлагай вариант юзать sed через системные вызовы, это хардкор)) За линк благодарю скачал 3 книги, то что нужно)
вообще я не подумал о том, чтобы дописать: "если тебе не в учебных целях, то задача решается одной командой sed'а" но если хочется хардкора)))) нельзя себе ни в чём отказывать и еще тебе возможно будет интересно: http://rutracker.org/forum/viewtopic.php?t=4216294 сам не смотрел, но очень хочу.. нет времени =(((((
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 Зачем тебе CURL? Делай на сокетах
Юмор в том что регулярки не годятся для разбора HTML. У того же тега a (http://htmlbook.ru/html/a) - есть куча атрибутов + атрибуты data в HTML5. Все они могут стоять в любом порядке, программа в которой жестко заданы регулярные выражения под определенную разметку - обречены по сути, так как разметка может меняться как угодно. Для HTML нужен хотя бы простой синтаксический анализатор - который будет различать теги и атрибуты в нем
Никто не говорит о распарсивании ДОМ на все елементы и атрибуты елементов, мне нужно банально выдернуть все линки по шаблону: Code: <a href=".*" class="class_name">.*</a> Юмор не в тему.
Юмор будет в тему, когда через 2 дня на веб ресурсе поменяют ссылки на <a class="class_name2" href=".*" >.*</a> И все твои труды пойдут на смарку. Блин, 2 человека уже тебе говорят, что нужно разбирать атрибуты внутри тега отдельно. 1. Найди тег <a(.*?)> 2. Возьми все что внутри и удали двойные пробелы \s\s на \s пока их не будет. 3. раздели строку по пробелам (тот же strtok или аналог explode в php или split) 4. найди нужный атрибут strpos href !== false 5. Получи его значение =['|"](.*?)['|"]$ 6. Ppofit + твоей программе будет похрен на извращения контенщиков.