Эффективный синтаксический анализ массива в C

Question

Эффективный синтаксический анализ массива в C

0

Я хочу эффективно анализировать массив символов. Каков правильный способ сделать это в c. Я новичок в программировании. Пожалуйста, направляйте меня.

данных 32 байт. 1-й байт - это версия, 2-й и 3-й байты - порядковый номер и т.д., Как указано ниже.

void parsepacket(u8_t data[]) {
    u8_t version = data[0];
    u16_t sequence_number = ?;
    u16_t error_status = ?;
    u8_t command_type = ?;
    u8_t attribute_count = ?;
    u8_t pay_load[25] = ?;
}

John Victor 06 дек. 2013, в 09:41

Источник

2

вы должны использовать struct
sundq 06 дек. 2013, в 08:37
0

payload - это одно слово, кстати.
Clifford 06 дек. 2013, в 20:38

Теги:

c++

arrays

c

embedded

byte

4 ответа

0

Самый "эффективный" метод может зависеть от ряда факторов, таких как:

является ли порядок байтов в массиве таким же, как в u16_t,
является ли целевая машина разрешенными байтовыми 16-разрядными словами,
поддерживает ли ваш компилятор способ структурирования упаковки
насколько переносимым или машинным/компилятором вы хотите, чтобы код был.
нужно ли вам копировать данные или просто переинтерпретировать его с помощью наложенной структуры (нулевой копии)

Ответы на большинство этих сценариев уже были даны.

Тем не менее, это всего лишь 32 байта - насколько эффективно это действительно нужно? Возможно, вам лучше ориентироваться на ясность и переносимость производительности, если в любом случае она будет соответствовать вашим ограничениям производительности.

Clifford 06 дек. 2013, в 18:30

0

Предполагая, что вам не нужно создавать переносимый код, вы можете сначала попытаться создать упакованную структуру, которая по определению удаляет дополнение или выравнивание с той же детализацией каждого элемента.

В gcc (вам может потребоваться проконсультироваться с руководством разработчика вашей цепочки инструментов), это было сделано с

struct __attribute__((__packed__)) foo {
     u8_t data;
     u16_t version;
     ...
     u8_t payload[25];

};

Вам также может потребоваться использовать код (посредством ASSERTING) для sizeof(struct foo) == 32. Это само по себе сложно сделать с препроцессором, но выполнимо (см. Комментарий также).

Следующая проблема заключается в проверке того, что архитектура позволяет читать слова из границ, отличных от слов. Один ключ может заключаться в том, что c-компилятор предупреждает об отклонениях от строгих правил выравнивания, которые следует воспринимать всерьез.

Одна из возможностей состоит в том, чтобы жестко закодировать преобразование, как уже упоминалось здесь. Если это повторяющийся шаблон, то, возможно, стоит построить анализатор времени выполнения, например, разбор.

int data(char *input, size_t input_length, const char *fmt_string, void *result)
{
   switch (*fmt_string)
   {
       case '\0':  break;
       case 'b' : 
          *result = input++; break;
       case 'w' :
          result = align_to(result, sizeof(uint16_t));
          *(uint16_t *)result = get_word(input);
          input+=sizeof(uint16_t); break;
    }
}

Который будет анализировать, например, строку "bWWbb25b", где капитализация может опционально обозначать утверждение.

Aki Suihkonen 06 дек. 2013, в 06:07

0

Здесь вопрос о порядке байтов выводится функции get_word ().
Aki Suihkonen 06 дек. 2013, в 09:56

0

Массив для аналогичного типа данных, например, вы можете массировать тип данных u8_t или u16_t и т.д. В этом случае было бы хорошо, если бы вы передали его как ссылку на структуру, например

typedef struct {
u8_t version;
u16_t sequence_number;
u16_t error_status;
u8_t command_type;
u8_t attribute_count;
u8_t pay_load[25];
..
} data_seq;

void parsepacket(data_seq *input) {

}

data_seq * ptr_dataseq; назовите его, используя

parsepacket(&ptr_dataseq);

kiranputtur 06 дек. 2013, в 06:04

0

На самом деле я хочу проанализировать данные из «data []» или * data. Я сделал некоторые изменения в коде.
John Victor 06 дек. 2013, в 08:44
0

Это не работает из-за отсутствия атрибута «упаковано»; и даже тогда на некоторых архитектурах ЦП (часто во встроенном мире) строгое выравнивание предотвращает извлечение uint16_t из не выровненного адреса.
Aki Suihkonen 06 дек. 2013, в 08:57

Ещё вопросы

Здесь вопрос о порядке байтов выводится функции get_word ().
На самом деле я хочу проанализировать данные из «data []» или * data. Я сделал некоторые изменения в коде.
Это не работает из-за отсутствия атрибута «упаковано»; и даже тогда на некоторых архитектурах ЦП (часто во встроенном мире) строгое выравнивание предотвращает извлечение uint16_t из не выровненного адреса.

Pandrei · Accepted Answer · 2013-12-06T06-54-00.000Z

Я думаю, это то, что вы ищете...

void parsepacket(const u8_t data[]) {  //same as u8_t*data
        u8_t version;
        u16_t sequence_number;
        u16_t error_status;
        u8_t command_type;
        u8_t attribute_count;
        u8_t pay_load[25];
        u8_t i =0;
        version = data[i];
        i++;
        sequence_number =(u16_t)(8<<data[i] + data[i+i]);
        i+=2;
        error_status = (u16_t)(8<<data[i] + data[i+i]);
        i+=2;
        attribute_count = data[i];
        i++;
        for(int j=0;j<25;j++)
          pay_load[j] = data[i++];
    }

Это предполагает порядок байтов Big Endian, который может или не может работать для вас.
Вы можете сделать memcopy и использовать соответствующие указатели, чтобы избежать операций сдвига, но я думаю, что идея заключалась в том, как читать данные ...