Новости из Блогов Code review #1

Discussion in 'Мировые новости. Обсуждения.' started by d3l3t3, 6 Aug 2012.

  1. d3l3t3

    d3l3t3 Banned

    Joined:
    3 Dec 2010
    Messages:
    1,771
    Likes Received:
    98
    Reputations:
    10
    Code review #1

    [​IMG]

    Вот и наступило время для первого обзора исходников от Kaimi и dx. Не все исходники попали в этот пост, потому что прислано их было немало. Не огорчайтесь, если не увидели своего творения, мы постараемся включить его в следующие выпуски!

    Начнет review Kaimi.

    Первый скрипт на Perl прислал Alexandr Alexeev. Сей скрипт показывает уведомления о новых письмах в трее. Ознакомиться с оригинальным кодом можно по этой ссылке. Оформление комментировать здесь и далее не планирую, так как сам предпочитаю так называемый Allman style, но с некоторыми модификациями, да и о вкусах не спорят. Итак, перейдем к авторскому коду:

    PHP:
    {
        
    my @depends qw/zenity gpg/;
        
    my $not_found;
        for(@
    depends) {
          
    warn "ERROR: $_ not found\n" and ++$not_found
            
    if(system("which $_ > /dev/null"));
        }
        exit 
    if($not_found);
    }
    Зачем было выделять этот фрагмент в отдельную область видимости, для меня остается загадкой, особенно учитывая небольшие размеры скрипта и отсутствие существенных объемов данных в памяти, которые освободились бы при выходе из неё. Список зависимостей можно было бы и не выносить в отдельную переменную, а написать, как сделано было в коде ниже:

    PHP:
    for(qw/zenity gpg/)
    {
    ....
    Для вывода информационных сообщений вместо вбивания статичного символа переноса строки лучше все же использовать специальную переменную $/.
    Смысл использования скобок в предпоследней строке тоже не ясен. Строчка тривиальная, да и далее по коду есть множество случаев опускания скобок в подобных ситуациях. Продолжим.

    PHP:
    my $json;
    if(
    $opts{'no-master-password'}) {
      
    $json = eval { read_file(CONFIG) };
      if($@) {
        die 
    'Failed to read '.CONFIG."\n";
      }
    } else {
      
    my $pw get_password();
      die 
    "get_password() returned undef\n" unless defined $pw;
      
    $json decrypt_file(CONFIG$pw);
      
    unless(defined $json) {
        
    message("Invalid password");
        exit 
    1;
      }
    }
    Функция decrypt_file используется во всем коде только один раз, CONFIG - глобальная константа. Не знаю, насколько целесообразно было делать генерик функцию и передавать в неё переменную в этом случае.

    PHP:
    while(1) {
      for 
    my $mailbox (@{$conf->{pop3_list}}) {
        
    my $pop = new Mail::POP3Client(
        
    USER     => $mailbox->{user},
        
    PASSWORD => $mailbox->{password},
        
    HOST     => $mailbox->{host},
        
    USESSL   => ($mailbox->{ssl} != 0),
          );
     
        
    my $count $pop->Count;
     
        if(
    $count 0) {
          
    message("$mailbox->{user}: ".$pop->Message);
        } 
    elsif($count 0) {
          
    message("$mailbox->{user}: $count new message(s)");
          if(
    $mailbox->{delete} != 0) {
        
    $pop->Delete($_) for (.. $count);
          }
        }
        
    $pop->Close;
      }
      
    sleep $conf->{main}{check_interval};
    }
    Объект в цикле создавать не стоит. Корректнее было бы создать его вне цикла, при этом не передавать в конструктор параметры USER и PASSWORD, а в цикле вызывать метод Connect. Хотя я и обещал не комментировать оформление, но все же стоит как-то унифицировать использование скобок и кавычек (в частности, при обращении к элементам ассоциативных массивов: то они есть, то их нет...).

    Следующим рассмотрим код, который создает файлы списков для зачисления (Сбербанк, dbf) из таблиц Excel файлов (xls), присланный Даниилом Поповым. Код полностью.

    PHP:
    #!/usr/bin/env perl
    use v5.14;
    use 
    warnings;
    use 
    strict;
    use 
    Encode qw (encode decode);
    use 
    Spreadsheet::ParseExcel;
    use Array::
    Transpose;
    use List::
    Util qw (max);
    use 
    XBase;
    use 
    locale;
    use 
    POSIX qw(locale_h);
    setlocaleLC_CTYPE"Russian_Russia.866" );
    setlocaleLC_COLLATE'Russian_Russia.866' ) or die 'locale!';
    Исходя из кодировки, скрипт используется под win* системами, причем в качестве консольного скрипта, следовательно, указание nix-style пути к интерпретатору не имеет особого смысла. Функция decode, импортированная из модуля Encode, в коде вообще не используется, а прагмы лучше подключать друг рядом с другом (strict, warnings, locale) чисто с эстетической точки зрения.

    PHP:
    my $parser   Spreadsheet::ParseExcel->new();
    my $fn       shift @ARGV;
    my $workbook $parser->parse("$fn");
    unless defined $workbook ) {
        die 
    $parser->error(), ".\n";
    }
    Обрамлять переменную в кавычки не стоило. В качестве переноса строки, как я говорил ранее, лучше бы было $/ использовать, да и в Windows \r\n используется по стандарту.

    PHP:
    my @array_of_rows;
    for 
    my $worksheet $workbook->worksheets() ) {
     
        
    #Берем  информацию о файле
        # строки
        
    my $row_min$row_max ) = $worksheet->row_range();
     
        
    # колонки
        
    my $col_min$col_max ) = $worksheet->col_range();
     
        
    # перебираем все значения в таблице
        
    for my $row $row_min .. $row_max ) {
            
    my $row_array = [];
            
    my $flag      0;
            for 
    my $col $col_min .. $col_max ) {
                
    my $cell $worksheet->get_cell$row$col );
                if ( 
    $cell and $cell->value() ) {
                    
    push $row_array$cell->value();
                    ++
    $flag;
                }
                else {
                    
    push $row_arrayundef;
                }
            }
            
    push @array_of_rows$row_array if $flag;
        }
    }
    В этом фрагменте видим использование push в применении к скаляру. Работать будет, но только для версии Perl >= 5.14 (что и было указано в начале скрипта), но смысл так делать? Подошел бы обычный массив, тем более "The exact behaviour may change in a future version of Perl.".

    PHP:
    my $hash_of_counts = {};
     
    for ( 
    my $i $i <= $#array_of_rows ; $i++ ) {
        
    $hash_of_counts->{"$i"} = 0;
        for ( @{ 
    $array_of_rows[$i] } ) {
            if (
    defined) {
                
    $hash_of_counts->{"$i"}++ if (/^\s*\d{20}\s*$/);
            }
        }
    }
    Этот фрагмент кода дублируется несколько раз, но с разным регулярным выражением. Стоило вынести в отдельную функцию. Переменная в кавычках, и снова зачем-то использован скаляр вместо того, чтобы обычный хэш создать. А ещё этот фрагмент можно заменить чем-нибудь типа:

    PHP:
    my $i 0;
    my %hash_of_counts map $i++ => scalar grep {defined && /^\s*\d{20}\s*$/} @{ $_ } } @array_of_rows;
    Комментировать использование модулей Spreadsheet::parseExcel и XBase не буду, так как не доводилось их использовать.
    Хочу сделать общий ко всем исходным кодам комментарий. Определитесь со стилем использования скобочек и кавычек. Выбирайте что-нибудь одно.

    PHP:
    $a->{$iили $a->{"$i"# Вдруг кому-то нравится брать переменные в кавычки
    $a->{vasyaили $a->{'vasya'}
    sleep(1или sleep 1
    # Имеется в виду использование константных строк без переменных внутри
    "123" или '123'
    # И стиль написания простых выражений
    sleep 1 if 0 или if(0) { sleep 1; }
    Напоследок: если ваш код предполагает обработку каких-то специальных входных данных (как последний скрипт), то прикладывайте по возможности пример этих входных данных в виде файла в соответствующем формате.
     
  2. d3l3t3

    d3l3t3 Banned

    Joined:
    3 Dec 2010
    Messages:
    1,771
    Likes Received:
    98
    Reputations:
    10
    Продолжает dx.

    Перейдем к ассемблеру (MASM32). Morgot B прислал сорс, который ищет файлы с заданными расширениями в указанной директории. Вот он. Начну с самого начала.

    Перейдем к ассемблеру (MASM32). Morgot B прислал сорс, который ищет файлы с заданными расширениями в указанной директории. Вот он. Начну с самого начала.

    PHP:
    include \masm32\include\windows.inc
    include \masm32\include\wininet.inc
    include \masm32\macros\macros.asm
    include \masm32\macros\windows.asm
    uselib kernel32
    ,masm32,user32
    Макросы - это хорошо. Упрощает код, пишем меньше строк.

    PHP:
    .const
    ;
    комментарий автора
    extnum equ 5 
    ;может на структуры переделать и lengthofв общем это к-тво расширений
     
    fd WIN32_FIND_DATA 
    <> ;FILE_ATTRIBUTE_DIRECTORY
    startDir db 
    "E:",;стартовая папка
    mask0 db 
    "*",;маска поиска
    buff db 512 dup 
    (0) ; -- вот этокстатинигде в программе не используется
     
    ;искомые расширения
    ext1 db 
    "jpg",0
    ext2 db 
    "doc",0
    ext3 db 
    "docx",0
    ext4 db 
    "mp3",0
    ext5 db 
    "torrent",0
    Если это простая программка предназначена исключительно для обучения, не стоит задаваться такими вопросами. В идеале было бы запрашивать расширения для поиска и стартовую директорию у пользователя, а не забивать их в код программы, но здесь это не важно.

    PHP:
    ;указатели
    pext1 dd offset ext1
    pext2 dd offset ext2
    pext3 dd offset ext3
    pext4 dd offset ext4
    pext5 dd offset ext5
    Я так понял, это своеобразный массив указателей на строки, чтобы можно было его перебирать и сравнивать расширение очередного файла с каждым из искомых. В реальности в программе используется только переменная pext1, так не проще ли переписать так:

    PHP:
    ;указатели
    pext1 dd offset ext1
    offset ext2offset ext3offset ext4offset ext5
    PHP:
    ;счетчики
    cext1 dd 0
    cext2 dd 0
    cext3 dd 0
    cext4 dd 0
    cext5 dd 0
    Такой же совет могу дать и тут - переписать это как массив dword'ов и его же использовать:

    PHP:
    ;счетчики
    cext dd dup 5
    (0)
    Смотрим дальше:

    PHP:
    invoke GetProcessHeap
        mov heapH
    ,eax
    invoke HeapAlloc
    ,heapH,HEAP_ZERO_MEMORY,1024
        mov lpMem
    ,eax
    Нет смысла выделять 1024 байта памяти на куче. Проще и гораздо быстрее будет выделить ее на стеке:

    PHP:
    LOCAL mem[1024]: BYTE
    Разумеется, чтобы сделать так, надо сначала образовать стековый фрейм, обернув весь код начиная от метки start и до invoke ExitProcess,0 в какую-то процедуру:

    PHP:
    main PROC
    LOCAL mem
    [1024]: BYTE
     
    ...
     
    ret
    main ENDP
    PHP:
    invoke wsprintf,lpMem,chr$("jpg - %d,doc - %d,docx - %d,mp3 - %d,torrent - %d"),cext1,cext2,cext3,cext4,cext5
    Если здесь мы перейдем к массиву dword'ов cext, то это выражение запишется так:

    PHP:
    invoke wsprintf,lpMem,chr$("jpg - %d,doc - %d,docx - %d,mp3 - %d,torrent - %d"),[cext],[cext 4],[cext 8],[cext 12],[cext 16]
    А отсюда уже легко перейти к циклу по всем переменным из массива, затолкнув их в стек, а потом вызвав wsprintf (хотя это необязательно, так как набор и количество искомых расширений фиксированы). Идем дальше:

    PHP:
    push offset startDir
    call findAll
    Тут можно было использовать invoke, тем более, прототип для функции findAll написан.

    PHP:
    invoke lstrcat,addr buf,offset mask0 ;добавляем маску
    invoke lstrlen
    ,p1 ;вычисляем длину папки с маской
    mov esi
    ,eax
        add esi
    ,sizeof mask0 ;добавляем длину маски
        mov byte ptr buf
    [esi],;добавляем нуллбайт
    Зачем все это? Функция WinAPI lstrcat всегда дописывает нуллбайт в конец строки, поэтому все действия с ручным его дописыванием лишние.

    PHP:
    invoke FindFirstFile,addr buf,offset fd
    Кстати, не понял, почему структура WIN32_FIND_DATA (fd) выделена в куче (точнее, в секции данных). Это убило часть возможностей функции findAll, и она никогда не сможет работать многопоточно. Впрочем, счетчики найденных расширений находятся там же, поэтому это скорее не недостаток, а упрощение.

    PHP:
        print "some error with FindFirstFile" ;уведомляем и выходим
        ret
    Я бы вывел ошибку в MessageBox, хотя это не столь важно, так как программа обучающая.

    Далее я вижу практически полное дублирование кода, что, естественно, не есть хорошо. Следовало бы реорганизовать код или вынести повторяющиеся моменты в отдельную функцию.

    PHP:
        invoke lstrlen,offset fd.cFileName
        mov len1
    ,eax
        push len1 
    ;длина имени файла передаем в функу
        push offset fd
    .cFileName ;адрес имени файла
    call GetExt 
    ;поиск валидного расширения
    Опять-таки, можно было бы заменить вызов через push-call на invoke. Кроме того, переменная len1, по сути, не нужна - можно было сделать push eax сразу после вызова lstrlen. Да и, чего уж там, по-хорошему в функцию GetExt надо было передать просто строку, а длину она бы посчитала сама, findAll не обязана за нее это делать. Длина потребовалась, если бы GetExt принимала какие-то двоичные данные - для них просчитать длину невозможно.

    Перейдем теперь к самой функции GetExt:

    PHP:
    std ;ищет расширение файла c конца
     
    parse_ext
    : ;search extension
    lodsb
    cmp al
    ,'.'
    je get_ext
    loop parse_ext
    cld
    Этот кусок можно было бы несколько ускорить и упростить, использовав команду scasb вместо lodsb и явного сравнения (не забыв учесть, что scasb работает с регистром edi, а не esi).

    Пожалуй, это все, что я хотел сказать по данному исходному коду.

    Вердикт: код не очень хороший (это простительно, так как автор, видимо, только учится), его можно сильно улучшить, есть, чему еще учиться. Из явных грехов видно несколько разных видов выделения памяти, хотя можно было бы все выделять на стеке (в данном случае, так как мы не выделяем больших объемов памяти), сделав тем самым все функции потокобезопасными; попеременное использование то макросов MASM32 вроде .if - .else, то операций вроде cmp - je (т.е. опять-таки нет единообразия, код тяжелее читается). Разные функции написаны с разными "конвенциями" вызовов - GetExt сохраняет регистры, findAll - нет. Я бы посоветовал использовать везде одно и то же общепринятое, например, stdcall: сохранять регистры esi, edi и ebx, значения передавать через стек в обратном порядке и очищать стек внутри функции, результат возвращать через eax.

    Перейдем к рассмотрению следующего исходного кода. Это "контроллер в некотором Zend Framework приложении для страницы управления проектами". Так как с Zend framework'ом мне приходилось работать очень давно и в течение достаточно короткого промежутка времени, то в плане архитектуры и использования методов Zend'а никаких рекомендаций дать я не смогу. Поэтому просто посмотрим на недостатки в самом коде. Вот он полностью.

    Во-первых, мне непонятно, почему прямо в коде присутствуют строки на русском языке. Наверняка Zend поддерживает локализацию. Хотя, вероятно, проект не планируется переводить на другие языки, он всегда будет поддерживаться только на русском, поэтому это нельзя считать серьезным недостатком, но строки вынести в отдельный ресурс я бы все-таки посоветовал - было бы гораздо проще править орфографические и пунктуационные ошибки без изменения самого кода, как минимум.

    PHP:
                $data Zend_Db_Table_Abstract::getDefaultAdapter()
                        ->
    fetchAll('SELECT email FROM ' TABLE_PREF 'users '
                        
    .'WHERE email LIKE ?'
                        
    .'AND role=1 ' //!! Роль номер 1 - клиенты
                        
    .'LIMIT 20;' // Не больше 20 в подсказке
                    
    '%' . ($_GET['query']) . '%');            
     
                
    $suggestions = array();
                foreach(
    $data as $email)
                    
    $suggestions[] = $email['email'];
     
                return 
    $this->_helper->json(array(
                    
    'query' => $_GET['query'],
                    
    'suggestions' => $suggestions
                
    ));
    По этому куску кода не могу в целом ничего сказать, но немного смущает полное отсутствие проверок входящих значений и экранирования. Метод fetchAll, скорее всего, производит экранирование, но что с методом/конструктором $this->_helper->json? Вероятно, есть уязвимость XSS. Еще интересно, что будет, если $_GET['query'] будет массивом. Стоит проверить этот момент.

    PHP:
            // Запрос на создание нового заказа
            
    if(isset($_POST['orderEmail']) && isset($_POST['project']) 
                    && 
    $_POST['orderEmail'] && $_POST['project'])
    Фукнция isset умеет принимать несколько аргументов сразу. Этот фрагмент кода можно было написать так:

    PHP:
            // Запрос на создание нового заказа
            
    if(isset($_POST['orderEmail'], $_POST['project']) 
                    && 
    $_POST['orderEmail'] && $_POST['project'])
    Еще я бы вместо явных проверок $_POST['orderEmail'] и $_POST['project'] использовал бы функцию empty.

    PHP:
                    if(isset($_POST['deleting']) 
                            && 
    $_POST['deleting']
                            && isset(
    $_POST['deleting'])
    Странное дублирование.

    Теперь итоги. В целом код выглядит весьма неплохо. В некоторых местах отсутствуют проверки ошибок (строки 122 и 129, например). Не исключаю вариант, что они там и не нужны. Отсутствует поддержка локализации, об этом я уже говорил. Вроде бы в критическим местах даже есть защита от CSRF, но не могу точно сказать, будет ли она хорошо работать. Больше, пожалуй, добавить ничего не могу. Вызываются методы неизвестного мне фреймворка, поэтому не могу полностью оценить, насколько это эффективно и безопасно.

    Вот и всё на сегодня. Присылайте новые исходники, и мы обязательно постараемся их рассмотреть. До встречи в следующем Code Review!

    Воскресенье, 5. Август 2012
    dx-kaimi
    http://kaimi.ru/2012/08/code-review-1/
     
  3. \/ITA

    \/ITA Member

    Joined:
    21 Sep 2011
    Messages:
    25
    Likes Received:
    28
    Reputations:
    8
    Спасибо!
    Очень интересно, особенно часть MASM про стек, не знал.