быстрое заполнение strcpy для одного слова

Question

быстрое заполнение strcpy для одного слова

0

Я пытаюсь написать очень дешевый фрагмент кода C++, чтобы выполнить следующую операцию в короткой нулевой завершаемой строке.

Вход представляет собой строку типа "ABC". Он имеет нулевой конец и имеет максимальную длину 4 (или 5 с нулевым терминатором).

Выход идет на char[4] который не является нулевым, и должен иметь пробел справа. Поэтому в этом случае это будут {'A','B','C',' '}

Это нормально предположить, что входная строка правильно завершена нулем, поэтому нет необходимости читать второе слово ввода, чтобы убедиться. 4 байта - это самое длинное, что может быть.

Таким образом, код вокруг него выглядит так:

char* input = "AB";
char output[4];
// code snippet goes here
// afterward output will be populated with {'A','B',' ',' '}

Как дешево это можно сделать? Если это имеет значение: я работаю с:

Linux 2.6.32-358.11.1.el6.x86_64 #1 SMP x86_64 x86_64 x86_64 GNU/Linux

Наконец, вход выравнивается по слову.

E_G 26 нояб. 2013, в 19:38

Источник

2

Имейте в виду, что быстрый и дешевый не то же самое, что хакерство, даже если для получения оптимальной скорости может потребоваться взлом. Не забудьте сравнить различные решения, иногда удивительно, что могут сделать компиляторы и современные процессоры;)
Antoine 26 нояб. 2013, в 18:52
0

Большое спасибо, Антуан. Я собираюсь сделать кучу сравнительного анализа этих. Я принял ваш ответ, потому что это был тот, кого я искал. Я попробовал несколько более очевидных решений с помощью циклов, но решил, что зайду в stackoverflow, чтобы посмотреть, сможет ли кто-нибудь создать решение без ответвлений, как вы. Это может быть не тот, который я использую.
E_G 26 нояб. 2013, в 18:55

Теги:

c++

c

strcpy

memcpy

word

6 ответов

1

Если скорость ваша проблема - используйте грубую силу.

Это не имеет доступа input за ее пределами, и не разрушает его.

 const char* input = TBD();
 char output[4] = {' '};
 if (input[0]) {
   output[0] = input[0];
   if (input[1]) {
     output[1] = input[1];
     if (input[2]) {
       output[2] = input[2];
       if (input[3]) {
         output[3] = input[3];
       }
     }
   }
 }

chux 26 нояб. 2013, в 17:12

1

char* input = "AB";
char output[4];

input += (output[0] = *input ? *input : ' ') != ' ';
input += (output[1] = *input ? *input : ' ') != ' ';
input += (output[2] = *input ? *input : ' ') != ' ';
output[3] = *input ? *input : ' ';

Обратите внимание, что это уничтожает исходный указатель input, поэтому сделайте копию этого, если вам нужно его сохранить.

Jonathan Potter 26 нояб. 2013, в 16:15

1

Для коротких строк, подобных этому, я не думаю, что вы можете сделать намного лучше, чем тривиальная реализация:

char buffer[4];

const char * input = "AB";
const char * in = input;
char * out = buffer;
char * end = buffer + sizeof buffer;

while (out < end)
{
    *out = *in != 0 ? *in++ : ' ';
    out++;
}

harald 26 нояб. 2013, в 15:50

0

Если ваш ввод имеет нулевое завершение, достаточно простого strcpy. Memcpy работает быстрее, но скопирует любой мусор, найденный после нулевого символа.

fernando.reyes 26 нояб. 2013, в 17:03

0

Я, конечно, мог бы использовать strcpy или memcpy, но должна быть возможность сделать это быстрее, потому что они будут смотреть на следующее слово в случае ввода длины 4. Кроме того, вывод должен быть дополнен пробелом, что может повлечь дополнительные расходы. strncpy с максимальной длиной 4 избегает смотреть на следующее слово, но все еще не заботится о пробелах.
E_G 26 нояб. 2013, в 18:09
0

Нет, strcpy не будет заполнять буфер, как он просит.
harald 26 нояб. 2013, в 18:11

0

Вы ищете memcpy:

char* input = "AB\0\0";
char output[4];
memcpy(output, input, 4);

Если ваш вход является переменным, сначала вам нужно рассчитать размер:

char* input = "AB";
std::size_t len = strlen(input);
char output[4] = {' ', ' ', ' ', ' '};
memcpy(output, input, std::min(4, len));

Zac Howland 26 нояб. 2013, в 16:19

0

Благодарю. Я знаком с memcpy, но я пытаюсь создать что-то быстрее, чем это, потому что а) strlen может излишне смотреть на другое слово ввода и б) это не пробел в выводе.
E_G 26 нояб. 2013, в 18:19
0

Единственный способ сделать это быстрее - это узнать длину заранее или написать собственную версию strlen которая принимает максимальную длину (есть нестандартное расширение strnlen которое делает именно это).
Zac Howland 26 нояб. 2013, в 18:57
0

Да, и для б), если вы хотите, чтобы вывод заканчивался пробелами, просто инициализируйте его как пробелы. memcpy перезапишет только те символы, которые ему нужны, и оставит пробелы.
Zac Howland 27 нояб. 2013, в 14:02

Показать ещё 1 комментарий

Ещё вопросы

Имейте в виду, что быстрый и дешевый не то же самое, что хакерство, даже если для получения оптимальной скорости может потребоваться взлом. Не забудьте сравнить различные решения, иногда удивительно, что могут сделать компиляторы и современные процессоры;)
Большое спасибо, Антуан. Я собираюсь сделать кучу сравнительного анализа этих. Я принял ваш ответ, потому что это был тот, кого я искал. Я попробовал несколько более очевидных решений с помощью циклов, но решил, что зайду в stackoverflow, чтобы посмотреть, сможет ли кто-нибудь создать решение без ответвлений, как вы. Это может быть не тот, который я использую.
Я, конечно, мог бы использовать strcpy или memcpy, но должна быть возможность сделать это быстрее, потому что они будут смотреть на следующее слово в случае ввода длины 4. Кроме того, вывод должен быть дополнен пробелом, что может повлечь дополнительные расходы. strncpy с максимальной длиной 4 избегает смотреть на следующее слово, но все еще не заботится о пробелах.
Нет, strcpy не будет заполнять буфер, как он просит.
Благодарю. Я знаком с memcpy, но я пытаюсь создать что-то быстрее, чем это, потому что а) strlen может излишне смотреть на другое слово ввода и б) это не пробел в выводе.
Единственный способ сделать это быстрее - это узнать длину заранее или написать собственную версию strlen которая принимает максимальную длину (есть нестандартное расширение strnlen которое делает именно это).
Да, и для б), если вы хотите, чтобы вывод заканчивался пробелами, просто инициализируйте его как пробелы. memcpy перезапишет только те символы, которые ему нужны, и оставит пробелы.

Antoine · Accepted Answer · 2013-11-26T16-34-00.000Z

Как насчет чего-то вроде этого:

typedef unsigned int word;
int spacePad(word input) {
    static const word spaces = 0x20202020;

    word mask =
       !input ?                0 :
       !(input & 0x00ffffff) ? 0xff:
       !(input & 0x0000ffff) ? 0xffff :
       !(input & 0x0000ff)   ? 0xffffff :
                               0xffffffff;
    // or without branches
    word branchless_mask =
       1u << (8 * (
         bool(input & 0xff000000) +
         bool(input & 0x00ff0000) +
         bool(input & 0x0000ff00) +
         bool(input & 0x000000ff)
       ));

    return (spaces & mask) | (input & ~mask);
}

И если я не spacePad(0xaabb0000), spacePad(0xaabb0000) будет 0xaabb2020.

Вместо вычислений и масок вы можете использовать встроенные функции SSE, которые, вероятно, будут быстрее, так как вы получите маску в нескольких инструкциях, а затем замаскированное перемещение сделает все остальное, но компилятор, вероятно, переместит ваши переменные arround из SSE к стандартным регистрам, которые могут привести к снижению веса. Все зависит от того, сколько данных вам нужно обрабатывать, как оно упаковано в память и т.д.

Если вход в char* а не int, обычно необходим дополнительный код, так как кастинг может считываться в нераспределенную память. Но так как вы упоминаете, что все строки выравниваются по словам, достаточно сделать актерский процесс, даже если есть несколько нераспределенных байтов, они находятся на том же слове, что и по меньшей мере один выделенный байт. Поскольку вы только читаете, нет риска повреждения памяти и всех архитектур, о которых я знаю, защита аппаратной памяти имеет зернистость, большую, чем слово. Например, на x86 страница памяти часто выравнивается по 4k.

Теперь, когда все хорошо и взломано, но: прежде чем выбрать решение, сравните его, что единственный способ узнать, что лучше для вас (за исключением, конечно, теплого нечеткого чувства написания кода, подобного этому ^^)

Благодарю. Я думаю, что это как можно ближе. Я надеялся на что-то совершенно безответственное, но это может быть невозможно. Очень признателен. Я собираюсь немного подождать, прежде чем принять, если кто-то придумает что-то без веток.
Вы уверены, что последний байт (после '\0' ) будет 0?
Проверено, проверено и исправлено опечатки, спасибо @GlennTeitelbaum
У меня возникают проблемы с версией без веток :) Что с исходной версией, что произойдет, если, скажем, input[2] == 0 и последний байт является мусором?
Я предполагаю, что мусора нет, но с небольшим количеством проблем вы можете справиться с этими случаями.
Возможно, вы захотите использовать unsigned int вместо int для константы, возвращаемого значения и аргумента функции.
Ни одна из версий на самом деле не имеет ответвлений. Вы должны были бы преобразовать char* в int (или, скорее, и в unsigned int ) и как-то иметь правильное выравнивание. Если input является "AB" , вы хотите, чтобы привести в соответствие , как "AB " . Все эти манипуляции должны произойти где-то (вы просто перемещаете их за пределы функции, в настоящее время).
Нет: достаточно простого приведения, и нет проблем с выравниванием, так как OP сказал, что charù выровнен по словам. Кроме того, поскольку мы выровнены по словам, преобразование может прочитать пару нераспределенных байтов, расположенных в выделенном слове, что не очень хорошо, но не повредит память, так как это чтение, и не будет сбоить, так как оно находится в слове alloc'd.
@ZacHowland: изменен на unsigned int и прояснил проблему преобразования char* . Благодарю.