Как преобразовать байтовый массив в шестнадцатеричную строку и наоборот?

Question

Как преобразовать байтовый массив в шестнадцатеричную строку и наоборот?

1215

Как вы можете преобразовать массив байтов в шестнадцатеричную строку и наоборот?

alextansc 22 нояб. 2008, в 09:44

Источник

5

Принятый ниже ответ, по-видимому, выделяет ужасное количество строк в преобразовании строки в байты. Мне интересно, как это влияет на производительность
Wim Coenen 06 март 2009, в 16:41
7

Класс SoapHexBinary делает именно то, что вы хотите, я думаю.
Mykroft 31 март 2010, в 20:44

Теги:

c#

arrays

hex

39 ответов

399

Анализ производительности

Примечание: новый лидер по состоянию на 2015-08-20.

Я запускал каждый из различных методов преобразования с помощью некоторого грубого тестирования производительности Stopwatch, пробега со случайным предложением (n = 61, 1000 итераций) и пробега с текстом Project Gutenburg (n = 1,238,957, 150 итераций). Вот результаты, от самого быстрого до самого медленного. Все измерения находятся в тиках (10 000 тиков = 1 мс), а все относительные ноты сравниваются с [самой медленной] реализацией StringBuilder. Для используемого кода см. Ниже или репозиторий тестовой среды, где я теперь поддерживаю код для его запуска.

отказ

ПРЕДУПРЕЖДЕНИЕ: не полагайтесь на эту статистику для чего-либо конкретного; это просто образец пробных данных. Если вам действительно нужна первоклассная производительность, пожалуйста, проверьте эти методы в среде, представляющей ваши производственные потребности, с данными, представляющими, что вы будете использовать.

Результаты

Поиск по байтам unsafe (через CodesInChaos) (добавлен в тестовое репо с помощью airbreather)
- Текст: 4 727,85 (105,2X)
- Приговор: 0,28 (99,7X)
Поиск по байтам (через CodesInChaos)
- Текст: 10 853,96 (45,8X быстрее)
- Предложение: 0,65 (на 42,7 раза быстрее)
Манипуляция байтов 2 (через CodesInChaos)
- Текст: 12 967,69 (38,4 раза быстрее)
- Предложение: 0,73 (37,9 раза быстрее)
Манипуляция байтами (через Waleed Eissa)
- Текст: 16 856,64 (на 29,5 раза быстрее)
- Предложение: 0.70 (на 39.5X быстрее)
Поиск/смена (через Натана Моинвазири)
- Текст: 23,201,23 (21,4 раза быстрее)
- Предложение: 1,24 (на 22,3 раза быстрее)
Поиск по грызуну (через Брайана Ламберта)
- Текст: 23 879,41 (на 20,8 раза быстрее)
- Приговор: 1,15 (на 23,9 раза быстрее)
BitConverter (через Tomalak)
- Текст: 113 269,34 (4,4 раза быстрее)
- Предложение: 9,98 (2,8 раза быстрее)
{SoapHexBinary}.ToString (через Mykroft)
- Текст: 178,601.39 (2.8X быстрее)
- Предложение: 10,68 (2,6 раза быстрее)
{byte}.ToString("X2") (используя foreach) (полученный от Will Dean)
- Текст: 308 805,38 (на 2,4 раза быстрее)
- Предложение: 16,89 (2,4 раза быстрее)
{byte}.ToString("X2") (используя {IEnumerable}.Aggregate, требуется System.Linq) (через Mark)
- Текст: 352 828,20 (на 2,1 раза быстрее)
- Предложение: 16,87 (2,4 раза быстрее)
Array.ConvertAll (используя string.Join) (через Will Dean)
- Текст: 675 451,57 (на 1,1 раза быстрее)
- Приговор: 17,95 (2,2 раза быстрее)
Array.ConvertAll (используя string.Concat, требуется.NET 4.0) (через Will Dean)
- Текст: 752 078,70 (на 1,0X быстрее)
- Предложение: 18,28 (2,2 раза быстрее)
{StringBuilder}.AppendFormat (используя foreach) (через Tomalak)
- Текст: 672,115.77 (на 1,1 раза быстрее)
- Предложение: 36,82 (1,1 раза быстрее)
{StringBuilder}.AppendFormat (используя {IEnumerable}.Aggregate, требуется System.Linq) (полученный от ответа Томалака)
- Текст: 718,380.63 (на 1.0X быстрее)
- Предложение: 39,71 (1,0X быстрее)

Таблицы поиска взяли на себя инициативу по манипулированию байтами. В принципе, существует некоторая форма предварительного вычисления того, что любой данный кусок или байт будет в шестнадцатеричном виде. Затем, когда вы копируете данные, вы просто просматриваете следующую часть, чтобы увидеть, какую шестую строку она будет. Это значение затем добавляется к результирующему выводу строки некоторым способом. В течение длительного времени манипулирование байтами, которое потенциально труднее было прочесть некоторыми разработчиками, было наиболее эффективным.

Ваш лучший выбор - это найти некоторые репрезентативные данные и попробовать их в производственной среде. Если у вас разные ограничения памяти, вы можете предпочесть метод с меньшим количеством распределений, который будет быстрее, но потребляет больше памяти.

Тестирование кода

Не стесняйтесь играть с кодом тестирования, который я использовал. Версия здесь включена, но вы можете клонировать репо и добавлять свои собственные методы. Отправьте запрос на перенос, если найдете что-нибудь интересное или хотите улучшить структуру тестирования, которую он использует.

Добавьте новый статический метод (Func<byte[], string>) в /Tests/ConvertByteArrayToHexString/Test.cs.
Добавьте это имя метода в возвращаемое значение TestCandidates в том же классе.
Убедитесь, что вы используете нужную версию ввода, предложение или текст, переключая комментарии в GenerateTestInput в том же классе.
Нажмите F5 и дождитесь выхода (дамп HTML также создается в папке /bin).

static string ByteArrayToHexStringViaStringJoinArrayConvertAll(byte[] bytes) {
    return string.Join(string.Empty, Array.ConvertAll(bytes, b => b.ToString("X2")));
}
static string ByteArrayToHexStringViaStringConcatArrayConvertAll(byte[] bytes) {
    return string.Concat(Array.ConvertAll(bytes, b => b.ToString("X2")));
}
static string ByteArrayToHexStringViaBitConverter(byte[] bytes) {
    string hex = BitConverter.ToString(bytes);
    return hex.Replace("-", "");
}
static string ByteArrayToHexStringViaStringBuilderAggregateByteToString(byte[] bytes) {
    return bytes.Aggregate(new StringBuilder(bytes.Length * 2), (sb, b) => sb.Append(b.ToString("X2"))).ToString();
}
static string ByteArrayToHexStringViaStringBuilderForEachByteToString(byte[] bytes) {
    StringBuilder hex = new StringBuilder(bytes.Length * 2);
    foreach (byte b in bytes)
        hex.Append(b.ToString("X2"));
    return hex.ToString();
}
static string ByteArrayToHexStringViaStringBuilderAggregateAppendFormat(byte[] bytes) {
    return bytes.Aggregate(new StringBuilder(bytes.Length * 2), (sb, b) => sb.AppendFormat("{0:X2}", b)).ToString();
}
static string ByteArrayToHexStringViaStringBuilderForEachAppendFormat(byte[] bytes) {
    StringBuilder hex = new StringBuilder(bytes.Length * 2);
    foreach (byte b in bytes)
        hex.AppendFormat("{0:X2}", b);
    return hex.ToString();
}
static string ByteArrayToHexViaByteManipulation(byte[] bytes) {
    char[] c = new char[bytes.Length * 2];
    byte b;
    for (int i = 0; i < bytes.Length; i++) {
        b = ((byte)(bytes[i] >> 4));
        c[i * 2] = (char)(b > 9 ? b + 0x37 : b + 0x30);
        b = ((byte)(bytes[i] & 0xF));
        c[i * 2 + 1] = (char)(b > 9 ? b + 0x37 : b + 0x30);
    }
    return new string(c);
}
static string ByteArrayToHexViaByteManipulation2(byte[] bytes) {
    char[] c = new char[bytes.Length * 2];
    int b;
    for (int i = 0; i < bytes.Length; i++) {
        b = bytes[i] >> 4;
        c[i * 2] = (char)(55 + b + (((b - 10) >> 31) & -7));
        b = bytes[i] & 0xF;
        c[i * 2 + 1] = (char)(55 + b + (((b - 10) >> 31) & -7));
    }
    return new string(c);
}
static string ByteArrayToHexViaSoapHexBinary(byte[] bytes) {
    SoapHexBinary soapHexBinary = new SoapHexBinary(bytes);
    return soapHexBinary.ToString();
}
static string ByteArrayToHexViaLookupAndShift(byte[] bytes) {
    StringBuilder result = new StringBuilder(bytes.Length * 2);
    string hexAlphabet = "0123456789ABCDEF";
    foreach (byte b in bytes) {
        result.Append(hexAlphabet[(int)(b >> 4)]);
        result.Append(hexAlphabet[(int)(b & 0xF)]);
    }
    return result.ToString();
}
static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_Lookup32, GCHandleType.Pinned).AddrOfPinnedObject();
static string ByteArrayToHexViaLookup32UnsafeDirect(byte[] bytes) {
    var lookupP = _lookup32UnsafeP;
    var result = new string((char)0, bytes.Length * 2);
    fixed (byte* bytesP = bytes)
    fixed (char* resultP = result) {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++) {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return result;
}
static uint[] _Lookup32 = Enumerable.Range(0, 255).Select(i => {
    string s = i.ToString("X2");
    return ((uint)s[0]) + ((uint)s[1] << 16);
}).ToArray();
static string ByteArrayToHexViaLookupPerByte(byte[] bytes) {
    var result = new char[bytes.Length * 2];
    for (int i = 0; i < bytes.Length; i++)
    {
        var val = _Lookup32[bytes[i]];
        result[2*i] = (char)val;
        result[2*i + 1] = (char) (val >> 16);
    }
    return new string(result);
}
static string ByteArrayToHexViaLookup(byte[] bytes) {
    string[] hexStringTable = new string[] {
        "00", "01", "02", "03", "04", "05", "06", "07", "08", "09", "0A", "0B", "0C", "0D", "0E", "0F",
        "10", "11", "12", "13", "14", "15", "16", "17", "18", "19", "1A", "1B", "1C", "1D", "1E", "1F",
        "20", "21", "22", "23", "24", "25", "26", "27", "28", "29", "2A", "2B", "2C", "2D", "2E", "2F",
        "30", "31", "32", "33", "34", "35", "36", "37", "38", "39", "3A", "3B", "3C", "3D", "3E", "3F",
        "40", "41", "42", "43", "44", "45", "46", "47", "48", "49", "4A", "4B", "4C", "4D", "4E", "4F",
        "50", "51", "52", "53", "54", "55", "56", "57", "58", "59", "5A", "5B", "5C", "5D", "5E", "5F",
        "60", "61", "62", "63", "64", "65", "66", "67", "68", "69", "6A", "6B", "6C", "6D", "6E", "6F",
        "70", "71", "72", "73", "74", "75", "76", "77", "78", "79", "7A", "7B", "7C", "7D", "7E", "7F",
        "80", "81", "82", "83", "84", "85", "86", "87", "88", "89", "8A", "8B", "8C", "8D", "8E", "8F",
        "90", "91", "92", "93", "94", "95", "96", "97", "98", "99", "9A", "9B", "9C", "9D", "9E", "9F",
        "A0", "A1", "A2", "A3", "A4", "A5", "A6", "A7", "A8", "A9", "AA", "AB", "AC", "AD", "AE", "AF",
        "B0", "B1", "B2", "B3", "B4", "B5", "B6", "B7", "B8", "B9", "BA", "BB", "BC", "BD", "BE", "BF",
        "C0", "C1", "C2", "C3", "C4", "C5", "C6", "C7", "C8", "C9", "CA", "CB", "CC", "CD", "CE", "CF",
        "D0", "D1", "D2", "D3", "D4", "D5", "D6", "D7", "D8", "D9", "DA", "DB", "DC", "DD", "DE", "DF",
        "E0", "E1", "E2", "E3", "E4", "E5", "E6", "E7", "E8", "E9", "EA", "EB", "EC", "ED", "EE", "EF",
        "F0", "F1", "F2", "F3", "F4", "F5", "F6", "F7", "F8", "F9", "FA", "FB", "FC", "FD", "FE", "FF",
    };
    StringBuilder result = new StringBuilder(bytes.Length * 2);
    foreach (byte b in bytes) {
        result.Append(hexStringTable[b]);
    }
    return result.ToString();
}

Обновление (2010-01-13)

Добавлен Waleed ответ на анализ. Довольно быстро.

Обновление (2011-10-05)

Добавлен вариант string.Concat Array.ConvertAll для полноты (требуется.NET 4.0). string.Join с string.Join версия.

Обновление (2012-02-05)

Test repo включает в себя больше вариантов, таких как StringBuilder.Append(b.ToString("X2")). Ничего не расстраивало результаты. foreach быстрее, чем {IEnumerable}.Aggregate, например, но BitConverter все еще выигрывает.

Обновление (2012-04-03)

Добавлен ответ Mykroft SoapHexBinary на анализ, который занял третье место.

Обновление (2013-01-15)

Добавлен ответ манипуляции байтами CodesInChaos, который занял первое место (с большим отрывом на больших блоках текста).

Обновление (2013-05-23)

Добавлен ответ Найтана Моинвазири и вариант из блога Брайана Ламберта. Оба довольно быстрые, но не лидирующие на тестовой машине, которую я использовал (AMD Phenom 9750).

Обновление (2014-07-31)

Добавлено @CodesInChaos новый байт-ответ поиска. Похоже, что он возглавил как тесты предложений, так и полнотекстовые тесты.

Обновление (2015-08-20)

Добавлена оптимизация airbreather и unsafe вариант для ответа на репо. Если вы хотите играть в небезопасной игре, вы можете получить огромный прирост производительности по сравнению с предыдущими победителями как коротких строк, так и больших текстов.

patridge 08 март 2009, в 23:45

0

Не могли бы вы проверить код из ответа Валида? Вроде бы очень быстро. stackoverflow.com/questions/311165/...
Cristi Diaconescu 24 дек. 2009, в 21:16
4

Несмотря на то, что я сделал код доступным для вас, чтобы сделать то, что вы сами запросили, я обновил код тестирования, включив в него ответ Waleed. Не говоря о раздражительности, это намного быстрее.
patridge 13 янв. 2010, в 16:29
0

Я получил другой результат, когда я использовал «ByteArrayToHexStringViaBitConverter» и «ByteArrayToHexStringViaStringBuilder». Последний оказался «правильным». Есть ли какая-то причина, по которой результат двух функций должен быть разным?
iJK 20 апр. 2010, в 22:11
0

Если это все еще происходит, лучшее, что я могу догадаться на данный момент, - это какая-то разновидность системной культуры, которая влияет на результаты.
patridge 04 окт. 2011, в 21:36
0

Можете ли вы добавить мое решение? В моем тесте это было примерно на 25% быстрее, чем ByteArrayToHexViaByteManipulation
CodesInChaos 15 янв. 2013, в 08:57
1

@CodesInChaos Готово. И в моих тестах он тоже немного выиграл. Я не претендую на то, чтобы полностью понять ни один из лучших методов, но они легко скрыты от прямого взаимодействия.
patridge 15 янв. 2013, в 18:01
0

Начиная с C # 4 (VS2010), наиболее естественным является String.Concat(bytes.Select(b => b.ToString("X2"))) . Обратите внимание, что мы не выделяем и не копируем во весь новый временный массив, как с Array.ConvertAll<> . Это решение было также дано @AllonGuralnek в комментарии к ответу Уилла Дина. Я думаю, мы можем согласиться, что люди будут использовать LINQ Select настоящее время.
Jeppe Stig Nielsen 08 апр. 2013, в 18:03
5

Этот ответ не намерен отвечать на вопрос о том, что является «естественным» или обычным явлением. Цель состоит в том, чтобы дать людям некоторые базовые показатели производительности, поскольку, когда вам нужно выполнить это преобразование, вы склонны делать их много. Если кому-то нужна грубая скорость, он просто запускает тесты с соответствующими тестовыми данными в нужной им вычислительной среде. Затем уберите этот метод в метод расширения, где вы никогда больше не посмотрите его реализацию (например, bytes.ToHexStringAtLudicrousSpeed() ).
patridge 08 апр. 2013, в 20:37
0

Попробуйте этот ответ: stackoverflow.com/a/5919521/356218 В моих тестах производительности (где-то на этом ответе) он немного быстрее, чем ByteArrayToHexViaByteManipulation но гораздо более чистый код
Thymine 06 май 2013, в 23:09
0

Я поместил его в структуру тестирования и дал запустить. Это, безусловно, достаточно быстро, чтобы люди могли использовать их в своих целях, хотя в тестах это не было лидерством.
patridge 04 июнь 2013, в 15:16
0

@CodesInChaos У меня есть реализация "bit fiddle", использующая один цикл для декодирования шестнадцатеричной строки. Хотите проверить? Блин за Коды за то, что я избил меня до мелочей: P
Maarten Bodewes 20 янв. 2014, в 23:20
1

Только что произвел реализацию на основе высокоэффективной таблицы поиска. Его безопасный вариант примерно на 30% быстрее, чем текущий лидер на моем процессоре. Небезопасные варианты еще быстрее. stackoverflow.com/a/24343727/445517
CodesInChaos 21 июнь 2014, в 17:12
0

@CodesInChaos Определенно быстрее в этой глупой среде тестирования, которую я собрал для этого ответа. Я обновил ответ и тестовый каркас репо. Я только добавил безопасный вариант, так что вы, вероятно, имеете эту ужасную скорость с этой небезопасной версией Отлично сделано, сэр.
patridge 31 июль 2014, в 22:42
0

Только что понял, что unsafe таблица поиска в тесте производительности верна только тогда, когда BitConverter.IsLittleEndian ( msdn.microsoft.com/en-us/library/… ) имеет значение true. @CodesInChaos оригинальный код обрабатывает это правильно. Не большая проблема, но у вас это есть.
Joe Amenta 27 авг. 2015, в 23:11
0

Спасибо, @JoeAmenta. Я подал ошибку в репозитории проекта, чтобы напомнить мне, чтобы исправить это. Не смотря на это слишком много прямо сейчас, похоже, что это должно быть достаточно просто, учитывая пример CodesInChaos.
patridge 28 авг. 2015, в 16:04
0

Обнаружена ошибка в ByteArrayToHexViaLookupPerByte вызывающая исключение IndexOutOfRangeException: массив _Lookup32 должен содержать 256 элементов, а не 255. Например, попробуйте выполнить ByteArrayToHexViaLookupPerByte(new byte[] { 255 })
lethek 08 авг. 2016, в 00:51
0

Отличный ответ. Я использовал второй вариант в вашем списке результатов stackoverflow.com/a/24343727/48700 и протестировал его с помощью веб-сокета SignalR для трансляции изображений слушателям без использования каких-либо файлов. На стороне javascript: var src = 'data: image / jpeg; base64,' + hexToBase64 (binimage); $ ("# aha"). attr ("src", src);
Goodies 06 сен. 2016, в 12:22
0

@Goodies Я обнаружил, что простой Convert.ToBase64String () ОЧЕНЬ быстр (быстрее, чем байт Lookup (через CodesInChaos)) в моем тестировании - так что, если кто-то не заботится о шестнадцатеричном выводе, это быстрый замена линии.
GilesDMiddleton 10 авг. 2018, в 09:44
0

@CodesInChaos отличная функция манипулирования байтами, спасибо!
metabuddy 15 март 2019, в 11:27

Показать ещё 17 комментариев

223

Там класс называется SoapHexBinary, который делает именно то, что вы хотите.

using System.Runtime.Remoting.Metadata.W3cXsd2001;

public static byte[] GetStringToBytes(string value)
{
    SoapHexBinary shb = SoapHexBinary.Parse(value);
    return shb.Value;
}

public static string GetBytesToString(byte[] value)
{
    SoapHexBinary shb = new SoapHexBinary(value);
    return shb.ToString();
}

Mykroft 31 март 2010, в 20:46

31

SoapHexBinary доступен в .NET 1.0 и находится в mscorlib. Несмотря на смешное пространство имен, он выполняет именно то, что задал вопрос.
Sly Gryphon 28 июнь 2011, в 06:48
2

Отличная находка! Обратите внимание, что вам нужно дополнить нечетные строки начальным 0 для GetStringToBytes, как и в другом решении.
Carter Medlin 31 окт. 2011, в 17:10
0

Вы видели реализацию мысли? Принятый ответ имеет лучшее ИМХО.
mfloryan 26 янв. 2012, в 13:42
0

Вы имеете в виду реализацию SoapHexBinary? Если так, что он делает, что делает его хуже, чем реализация в принятом ответе?
Mykroft 26 янв. 2012, в 19:20
6

Интересно увидеть реализацию Mono здесь: github.com/mono/mono/blob/master/mcs/class/corlib/…
Jeremy 29 апр. 2012, в 04:40
0

В моих тестах (которые я собираюсь добавить в ответ), Моно импл. примерно на 10% быстрее, чем SoapHexBinary , и в 16 раз медленнее, чем у меня ...
Ben Mosher 22 май 2012, в 16:39

Показать ещё 4 комментария

135

При написании криптокода это часто встречается, чтобы избежать зависящих от данных ветвей и поиска таблиц, чтобы гарантировать, что время выполнения не зависит от данных, поскольку время, зависящее от данных, может привести к атакам в боковых каналах.

Это также довольно быстро.

static string ByteToHexBitFiddle(byte[] bytes)
{
    char[] c = new char[bytes.Length * 2];
    int b;
    for (int i = 0; i < bytes.Length; i++) {
        b = bytes[i] >> 4;
        c[i * 2] = (char)(55 + b + (((b-10)>>31)&-7));
        b = bytes[i] & 0xF;
        c[i * 2 + 1] = (char)(55 + b + (((b-10)>>31)&-7));
    }
    return new string(c);
}

_{Ph'nglui mglw'nafh Cthulhu R'lyeh wgah'nagl fhtagn}

Отказаться от всякой надежды, вы, входящие сюда

Объяснение странного бита:

bytes[i] >> 4 извлекает большой кусок байта
bytes[i] & 0xF извлекает низкий кусок байта
b - 10
< 0 для значений b < 10, который станет десятичной цифрой
>= 0 для значений b > 10, который станет буквой от A до F.
Использование i >> 31 для подписанного 32-битного целого извлекает знак, благодаря расширению знака. Это будет -1 для i < 0 и 0 для i >= 0.
Сочетание 2) и 3), показывает, что (b-10)>>31 будет 0 для букв и -1 для цифр.
Рассматривая регистр букв, последнее слагаемое становится 0, а b находится в диапазоне от 10 до 15. Мы хотим сопоставить его с A (65) и F (70), что означает добавление 55 ('A'-10).
Рассматривая случай для цифр, мы хотим адаптировать последнее слагаемое, чтобы оно отображало b из диапазона от 0 до 9 в диапазон от 0 (48) до 9 (57). Это означает, что ему нужно стать -7 ('0' - 55).
Теперь мы можем просто умножить на 7. Но так как -1 представляется всеми битами равными 1, мы можем вместо этого использовать & -7 с (0 & -7) == 0 и (-1 & -7) == -7.

Некоторые дополнительные соображения:

Я не использовал вторую переменную цикла для индексации в c, так как измерение показывает, что вычисление ее из i дешевле.
Используя ровно i < bytes.Length, поскольку верхняя граница цикла позволяет JITter устранять проверки границ на bytes[i], поэтому я выбрал этот вариант.
Создание b int позволяет ненужные преобразования из и в байты.

CodesInChaos 15 янв. 2013, в 09:14

7

И hex string в byte[] array ?
AaA 18 янв. 2013, в 07:56
13

+1 за правильное цитирование вашего источника после вызова этого чёрного волшебства. Приветствую Ктулху.
Edward 02 авг. 2013, в 20:41
0

Лучший ответ (для шестнадцатеричной части вопроса)!
dolmen 20 авг. 2013, в 23:43
4

Как насчет строки в байте []?
Syaiful Nizam Yahya 06 нояб. 2013, в 10:14
0

Что я хотел сказать, если у меня есть «0x1B», как я могу преобразовать это в байт?
Syaiful Nizam Yahya 07 нояб. 2013, в 03:59
9

Ницца! Для тех, кому нужен строчный вывод, выражение явно меняется на 87 + b + (((b-10)>>31)&-39)
eXavier 06 янв. 2014, в 17:36
0

Теперь я получил его в Java и C # для кодирования и декодирования, чтобы показать мою «темную магию» (один цикл, без ветвей, кроме последнего за шестнадцатеричные ошибки). Отдельно от вашего краткого кода, конечно, я иногда люблю ломать голову.
Maarten Bodewes 20 янв. 2014, в 23:17
0

@ Ааа, ты хочешь преобразовать его в массив байтовых массивов? ;)
CoolOppo 10 июнь 2015, в 02:46
0

@CoolOppo, я не уверен, что вы имеете в виду, но шестнадцатеричная строка имеет формат "123456789ABCDEF" , означая, что каждые два символа преобразуются в one byte
AaA 10 июнь 2015, в 02:59
1

@AaA Вы сказали « byte[] array », что буквально означает массив байтовых массивов или byte[][] . Я просто подшучивал.
CoolOppo 10 июнь 2015, в 03:09
0

Почему бы просто не использовать 'A'-0xA вместо 55 ? Позвольте компилятору понять это; магические числа, такие как 55 , не всегда понятны людям и подвержены ошибкам.
David R Tribble 16 июль 2018, в 15:44
0

@DavidRTribble Потому что я не хочу брать на себя венок Великого Лорда Ктулху.
CodesInChaos 16 июль 2018, в 17:43
0

@CodesInChaos - я знаю, что ты имел в виду гнев . Но видите, это проблема с 101 символом, который я, конечно, написал бы как 'e' . ;-)
David R Tribble 23 июль 2018, в 15:47

Показать ещё 11 комментариев

89

Если вы хотите больше гибкости, чем BitConverter, но не хотите, чтобы эти неуклюжие явные петли типа 1990-х годов, вы можете сделать:

String.Join(String.Empty, Array.ConvertAll(bytes, x => x.ToString("X2")));

Или, если вы используете .NET 4.0:

String.Concat(Array.ConvertAll(bytes, x => x.ToString("X2")));

(Последний из комментария к исходному сообщению.)

Will Dean 22 нояб. 2008, в 16:23

20

Еще короче: String.Concat (Array.ConvertAll (bytes, x => x.ToString ("X2"))
Nestor 25 нояб. 2009, в 15:04
0

Просто обратите внимание, что хорошая техника maxc нуждается в .net 4.0
Will Dean 25 нояб. 2009, в 22:05
14

Еще короче: String.Concat (bytes.Select (b => b.ToString ("X2"))) [.NET4]
Allon Guralnek 16 июнь 2011, в 06:39
14

Только отвечает на половину вопроса.
Sly Gryphon 28 июнь 2011, в 06:50
1

Зачем второму нужен .Net 4? String.Concat находится в .Net 2.0.
Polyfun 17 окт. 2014, в 11:42
1

эти петли в стиле «90-х», как правило, быстрее, но на ничтожно малое количество, что не имеет значения в большинстве случаев. Стоит упомянуть, хотя
Austin_Anderson 24 окт. 2017, в 19:47

Показать ещё 4 комментария

57

Вы можете использовать метод BitConverter.ToString:

byte[] bytes = {0, 1, 2, 4, 8, 16, 32, 64, 128, 256}
Console.WriteLine( BitConverter.ToString(bytes));

Вывод:

00-01-02-04-08-10-20-40-80-FF

Дополнительная информация: метод BitConverter.ToString (байт [])

Baget 22 нояб. 2008, в 14:24

10

Только отвечает на половину вопроса.
Sly Gryphon 28 июнь 2011, в 06:49
2

Где вторая часть ответа?
Sawan 25 дек. 2012, в 09:12

54

Другой подход на основе таблицы поиска. В этом случае для каждого байта используется только одна таблица поиска, а не таблица поиска за кусочек.

private static readonly uint[] _lookup32 = CreateLookup32();

private static uint[] CreateLookup32()
{
    var result = new uint[256];
    for (int i = 0; i < 256; i++)
    {
        string s=i.ToString("X2");
        result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
    }
    return result;
}

private static string ByteArrayToHexViaLookup32(byte[] bytes)
{
    var lookup32 = _lookup32;
    var result = new char[bytes.Length * 2];
    for (int i = 0; i < bytes.Length; i++)
    {
        var val = lookup32[bytes[i]];
        result[2*i] = (char)val;
        result[2*i + 1] = (char) (val >> 16);
    }
    return new string(result);
}

Я также тестировал варианты этого с использованием ushort, struct{char X1, X2}, struct{byte X1, X2} в таблице поиска.

В зависимости от цели компиляции (x86, X64) они либо имели примерно такую же производительность, либо были немного медленнее, чем этот вариант.

И для еще более высокой производительности, его unsafe sibling:

private static readonly uint[] _lookup32Unsafe = CreateLookup32Unsafe();
private static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_lookup32Unsafe,GCHandleType.Pinned).AddrOfPinnedObject();

private static uint[] CreateLookup32Unsafe()
{
    var result = new uint[256];
    for (int i = 0; i < 256; i++)
    {
        string s=i.ToString("X2");
        if(BitConverter.IsLittleEndian)
            result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
        else
            result[i] = ((uint)s[1]) + ((uint)s[0] << 16);
    }
    return result;
}

public static string ByteArrayToHexViaLookup32Unsafe(byte[] bytes)
{
    var lookupP = _lookup32UnsafeP;
    var result = new char[bytes.Length * 2];
    fixed(byte* bytesP = bytes)
    fixed (char* resultP = result)
    {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++)
        {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return new string(result);
}

Или если вы считаете приемлемым запись в строку напрямую:

public static string ByteArrayToHexViaLookup32UnsafeDirect(byte[] bytes)
{
    var lookupP = _lookup32UnsafeP;
    var result = new string((char)0, bytes.Length * 2);
    fixed (byte* bytesP = bytes)
    fixed (char* resultP = result)
    {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++)
        {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return result;
}

CodesInChaos 21 июнь 2014, в 18:34

0

Почему при создании таблицы поиска в небезопасной версии меняются кусочки предварительно вычисленного байта? Я думал, что порядок байтов только изменил порядок объектов, которые были сформированы из нескольких байтов.
Raif Atef 05 нояб. 2014, в 13:13
0

@RaifAtef Здесь важен не порядок грызунов. Но порядка 16 битных слов в 32-битном целом числе. Но я подумываю переписать его, чтобы один и тот же код мог выполняться независимо от порядка байтов.
CodesInChaos 07 нояб. 2014, в 12:09
0

Перечитывая код, я думаю, что вы сделали это, потому что когда вы приводите char * позже к uint * и присваиваете его (при генерации шестнадцатеричного char), среда выполнения / CPU переворачивают байты (поскольку uint не обрабатывается то же самое, что 2 отдельных 16-битных символа), поэтому вы предварительно переворачиваете их для компенсации. Я прав ? Endianness сбивает с толку :-).
Raif Atef 07 нояб. 2014, в 13:26
0

Хорошо, я _lookup32Unsafe - какое преимущество в том, чтобы бесконечно закреплять _lookup32Unsafe вместо того, чтобы просто делать третий fixed оператор и позволять GC перемещать массив в соответствии с его содержанием, когда этот метод не работает?
Joe Amenta 09 янв. 2016, в 12:24
0

@JoeAmenta Не уверен, есть ли какое-либо измеримое преимущество в этом случае. Возможно, я просто не думал об этой альтернативе, когда писал этот код.
CodesInChaos 09 янв. 2016, в 15:32
3

Это просто ответ на половину вопроса ... Как насчет шестнадцатеричной строки в байтах?
Narvalex 08 март 2017, в 17:28
0

Почему только небезопасный вариант проверяет порядок байтов? Первый пример, кажется, просто предполагает, что машина - маленький индийский.
TamaMcGlinn 30 янв. 2018, в 10:33
0

@TamaMcGlinn Безопасная реализация использует little-endian для своего внутреннего представления, но не делает предположений о машинном порядке. Так что он все равно должен работать на машинах с прямым порядком байтов (возможно, немного медленнее). В отличие от этого небезопасный вариант повторно интерпретирует два 16-битных слова как одно 32-битное слово, поэтому он должен быть осторожен с порядком байтов хоста.
CodesInChaos 30 янв. 2018, в 11:00

Показать ещё 6 комментариев

50

Сегодня я столкнулся с одной и той же проблемой, и я наткнулся на этот код:

private static string ByteArrayToHex(byte[] barray)
{
    char[] c = new char[barray.Length * 2];
    byte b;
    for (int i = 0; i < barray.Length; ++i)
    {
        b = ((byte)(barray[i] >> 4));
        c[i * 2] = (char)(b > 9 ? b + 0x37 : b + 0x30);
        b = ((byte)(barray[i] & 0xF));
        c[i * 2 + 1] = (char)(b > 9 ? b + 0x37 : b + 0x30);
    }
    return new string(c);
}

Источник: сообщение форума byte [] Array to Hex String (см. сообщение от PZahra). Я немного изменил код, чтобы удалить префикс 0x.

Я проверил некоторые тесты производительности кода, и это было почти в восемь раз быстрее, чем использование BitConverter.ToString() (самое быстрое в соответствии с положением patridge).

Waleed Eissa 11 март 2009, в 01:55

0

не говоря уже о том, что для этого используется меньше всего памяти. Никаких промежуточных строк не создано.
Chochos 16 окт. 2009, в 17:36
7

Только отвечает на половину вопроса.
Sly Gryphon 28 июнь 2011, в 06:50
0

Это здорово, потому что он работает практически на любой версии NET, включая NETMF. Победитель!
Jonesome 06 фев. 2012, в 04:26
1

Принятый ответ предоставляет 2 превосходных метода HexToByteArray, которые представляют другую половину вопроса. Решение Waleed отвечает на вопрос о том, как это сделать, не создавая огромное количество строк в процессе.
Brendten Eickstaedt 10 окт. 2012, в 16:08
0

Копирует и перераспределяет ли новая строка (c) или она достаточно умна, чтобы знать, когда она может просто обернуть символ []?
jjxtra 15 окт. 2013, в 17:24
0

@PsychoDad, он копирует. Строка должна быть неизменной, в то время как char [] может измениться после создания строки.
Brian Reichle 21 янв. 2014, в 06:51
0

@SlyGryphon На самом деле, если вы прокрутите вниз от упомянутого поста на форуме, я фактически предоставил другую сторону того, что было обновлено здесь: stackoverflow.com/a/22158486/278889
Patrick 27 сен. 2018, в 14:59

Показать ещё 5 комментариев

15

Эта проблема также может быть решена с использованием справочной таблицы. Это потребует небольшого количества статической памяти как для кодировщика, так и для декодера. Однако этот метод будет быстрым:

Таблица кодировщика 512 байтов или 1024 байта (в два раза размер, если и верхний, и нижний регистр необходимо)
Таблица декодера 256 байты или 64 KiB (либо один просмотр char или двойной поиск char)

Мое решение использует 1024 байты для таблицы кодирования и 256 байтов для декодирования.

Декодирование

private static readonly byte[] LookupTable = new byte[] {
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0x00, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 0x08, 0x09, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x0F, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x0F, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF
};

private static byte Lookup(char c)
{
  var b = LookupTable[c];
  if (b == 255)
    throw new IOException("Expected a hex character, got " + c);
  return b;
}

public static byte ToByte(char[] chars, int offset)
{
  return (byte)(Lookup(chars[offset]) << 4 | Lookup(chars[offset + 1]));
}

Кодировка

private static readonly char[][] LookupTableUpper;
private static readonly char[][] LookupTableLower;

static Hex()
{
  LookupTableLower = new char[256][];
  LookupTableUpper = new char[256][];
  for (var i = 0; i < 256; i++)
  {
    LookupTableLower[i] = i.ToString("x2").ToCharArray();
    LookupTableUpper[i] = i.ToString("X2").ToCharArray();
  }
}

public static char[] ToCharLower(byte[] b, int bOffset)
{
  return LookupTableLower[b[bOffset]];
}

public static char[] ToCharUpper(byte[] b, int bOffset)
{
  return LookupTableUpper[b[bOffset]];
}

Сравнение

StringBuilderToStringFromBytes:   106148
BitConverterToStringFromBytes:     15783
ArrayConvertAllToStringFromBytes:  54290
ByteManipulationToCharArray:        8444
TableBasedToCharArray:              5651 *

* это решение

Примечание

При декодировании может произойти событие IOException и IndexOutOfRangeException (если символ имеет слишком высокое значение > 256). Методы де-кодирования потоков или массивов должны быть реализованы, это всего лишь доказательство концепции.

drphrozen 08 июнь 2011, в 07:38

1

Использование памяти в 256 байтов незначительно при запуске кода в CLR.
dolmen 21 авг. 2013, в 00:05

14

Это ответ на пересмотренный вариант 4 популярного ответа Томалака (и последующих изменений).

Я сделаю так, что это изменение неверно, и объясните, почему оно может быть отменено. По пути вы можете узнать кое-что о некоторых внутренних элементах и посмотреть еще один пример того, что такое преждевременная оптимизация и как она может вас укусить.

tl; dr: Просто используйте Convert.ToByte и String.Substring если вы спешите ("Исходный код" ниже), это лучшая комбинация, если вы не хотите повторно реализовывать Convert.ToByte. Используйте что-то более продвинутое (см. Другие ответы), который не использует Convert.ToByte если вам нужна производительность. Есть ли что - нибудь еще, кроме не использовать String.Substring в сочетании с Convert.ToByte, если кто - то есть что - то интересное, чтобы сказать об этом в комментариях этого ответа.

warning: этот ответ может устареть, если в инфраструктуре реализована перегрузка Convert.ToByte(char[], Int32). Это вряд ли произойдет в ближайшее время.

Как правило, мне не очень нравится говорить "не оптимизировать преждевременно", потому что никто не знает, когда "преждевременно". Единственное, что вы должны учитывать при принятии решения о том, следует ли оптимизировать или нет, это: "У меня есть время и ресурсы для правильного изучения подходов к оптимизации?". Если вы этого не сделаете, то это слишком рано, подождите, пока ваш проект станет более зрелым или пока вам не понадобится производительность (если есть настоящая необходимость, тогда вы сделаете время). Тем временем сделайте простейшую вещь, которая могла бы работать вместо этого.

Исходный код:

    public static byte[] HexadecimalStringToByteArray_Original(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        for (var i = 0; i < outputLength; i++)
            output[i] = Convert.ToByte(input.Substring(i * 2, 2), 16);
        return output;
    }

Редакция 4:

    public static byte[] HexadecimalStringToByteArray_Rev4(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        using (var sr = new StringReader(input))
        {
            for (var i = 0; i < outputLength; i++)
                output[i] = Convert.ToByte(new string(new char[2] { (char)sr.Read(), (char)sr.Read() }), 16);
        }
        return output;
    }

В редакции избегается String.Substring и вместо этого используется StringReader. Данная причина такова:

Изменение: вы можете повысить производительность для длинных строк с помощью парсера с одним проходом, например:

Ну, глядя на ссылочный код для String.Substring, он явно "однопроходный" уже; и почему бы и нет? Он работает на уровне байта, а не на суррогатных парах.

Однако он выделяет новую строку, но тогда вам нужно выделить один, чтобы передать Convert.ToByte любом случае. Кроме того, решение, предоставленное в ревизии, выделяет еще один объект на каждой итерации (массив с двумя символами); вы можете спокойно разместить это выделение вне цикла и повторно использовать массив, чтобы этого избежать.

    public static byte[] HexadecimalStringToByteArray(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        var numeral = new char[2];
        using (var sr = new StringReader(input))
        {
            for (var i = 0; i < outputLength; i++)
            {
                numeral[0] = (char)sr.Read();
                numeral[1] = (char)sr.Read();
                output[i] = Convert.ToByte(new string(numeral), 16);
            }
        }
        return output;
    }

Каждая шестнадцатеричная numeral представляет один октет, используя две цифры (символы).

Но тогда зачем звонить StringReader.Read дважды? Просто вызовите его вторую перегрузку и попросите ее сразу прочитать два символа в массиве с двумя символами; и уменьшить количество звонков на два.

    public static byte[] HexadecimalStringToByteArray(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        var numeral = new char[2];
        using (var sr = new StringReader(input))
        {
            for (var i = 0; i < outputLength; i++)
            {
                var read = sr.Read(numeral, 0, 2);
                Debug.Assert(read == 2);
                output[i] = Convert.ToByte(new string(numeral), 16);
            }
        }
        return output;
    }

То, что у вас осталось, - это строковый ридер, единственным добавленным "значением" является параллельный индекс (внутренний _pos), который вы могли бы объявить сами (например, j), избыточную переменную длины (внутреннюю _length) и избыточную ссылку к входной строке (internal _s). Другими словами, это бесполезно.

Если вам интересно, как Read "читает", просто посмотрите на код, все, что он делает, это вызов String.CopyTo во входной строке. Остальное - это просто накладные расходы, чтобы поддерживать ценности, которые нам не нужны.

Итак, удалите строковый ридер и вызовите CopyTo самостоятельно; он проще, яснее и эффективнее.

    public static byte[] HexadecimalStringToByteArray(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        var numeral = new char[2];
        for (int i = 0, j = 0; i < outputLength; i++, j += 2)
        {
            input.CopyTo(j, numeral, 0, 2);
            output[i] = Convert.ToByte(new string(numeral), 16);
        }
        return output;
    }

Вам действительно нужен индекс j который увеличивается с шагом в два параллельно с i? Конечно, нет, просто умножьте i на два (которые компилятор должен иметь возможность оптимизировать до добавления).

    public static byte[] HexadecimalStringToByteArray_BestEffort(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        var numeral = new char[2];
        for (int i = 0; i < outputLength; i++)
        {
            input.CopyTo(i * 2, numeral, 0, 2);
            output[i] = Convert.ToByte(new string(numeral), 16);
        }
        return output;
    }

Как выглядит решение теперь? Точно так же, как в начале, только вместо того, чтобы использовать String.Substring для выделения строки и копирования данных на нее, вы используете промежуточный массив, в который вы скопируете шестнадцатеричные цифры, а затем выделите строку самостоятельно и скопируйте данные снова из массива и в строку (когда вы передаете ее в конструкторе строк). Вторая копия может быть оптимизирована, если строка уже находится в String.Substring пуле, но тогда String.Substring также сможет избежать этого в этих случаях.

Фактически, если вы снова посмотрите на String.Substring, вы увидите, что он использует некоторые низкоуровневые внутренние знания о том, как строятся строки, чтобы выделять строку быстрее, чем вы могли бы это сделать, и она встраивает один и тот же код, используемый CopyTo напрямую чтобы избежать накладных расходов на вызов.

String.Substring

Худший случай: одно быстрое распределение, одна быстрая копия.
Наилучший вариант: нет выделения, нет копии.

Ручной метод

Худший случай: два обычных распределения, одна нормальная копия, одна быстрая копия.
Лучшее: одно нормальное распределение, одна нормальная копия.

Вывод? Если вы хотите использовать Convert.ToByte(String, Int32) (потому что вы не хотите повторно реализовывать эту функциональность самостоятельно), похоже, нет способа победить String.Substring; все, что вы делаете, запускается кругами, повторно изобретая колесо (только с неоптимальными материалами).

Обратите внимание, что использование Convert.ToByte и String.Substring - совершенно правильный выбор, если вам не нужна экстремальная производительность. Помните: выбирайте альтернативу, если у вас есть время и ресурсы для исследования того, как она работает правильно.

Если бы существовал Convert.ToByte(char[], Int32), все было бы по-другому (можно было бы сделать то, что я описал выше, и полностью избежать String).

Я подозреваю, что люди, которые сообщают о лучшей производительности, "избегая String.Substring ", также избегают Convert.ToByte(String, Int32), которые вы действительно должны делать, если вам нужна производительность в любом случае. Посмотрите на множество других ответов, чтобы узнать все различные подходы к этому.

Отказ от ответственности: я не декомпилировал последнюю версию фреймворка, чтобы проверить, что исходный источник является актуальным, я предполагаю, что это так.

Теперь все звучит хорошо и логично, надеюсь, даже очевидно, если вам удастся до сих пор. Но верно ли это?

Intel(R) Core(TM) i7-3720QM CPU @ 2.60GHz
    Cores: 8
    Current Clock Speed: 2600
    Max Clock Speed: 2600
--------------------
Parsing hexadecimal string into an array of bytes
--------------------
HexadecimalStringToByteArray_Original: 7,777.09 average ticks (over 10000 runs), 1.2X
HexadecimalStringToByteArray_BestEffort: 8,550.82 average ticks (over 10000 runs), 1.1X
HexadecimalStringToByteArray_Rev4: 9,218.03 average ticks (over 10000 runs), 1.0X

Да!

Реквизиты для Partridge для платформы скамейки, ее легко взломать. Используемый вход следующий SHA-1 хэш повторяется 5000 раз, чтобы сделать строку длиной 100 000 байт.

209113288F93A9AB8E474EA78D899AFDBB874355

Повеселись! (Но оптимизируйте с умеренностью.)

tne 10 окт. 2014, в 18:09

12

Дополнение для ответа с помощью @CodesInChaos (обратный метод)

public static byte[] HexToByteUsingByteManipulation(string s)
{
    byte[] bytes = new byte[s.Length / 2];
    for (int i = 0; i < bytes.Length; i++)
    {
        int hi = s[i*2] - 65;
        hi = hi + 10 + ((hi >> 31) & 7);

        int lo = s[i*2 + 1] - 65;
        lo = lo + 10 + ((lo >> 31) & 7) & 0x0f;

        bytes[i] = (byte) (lo | hi << 4);
    }
    return bytes;
}

Пояснение:

& 0x0f должен поддерживать также строчные буквы

hi = hi + 10 + ((hi >> 31) & 7); совпадает с:

hi = ch-65 + 10 + (((ch-65) >> 31) & 7);

Для '0'.. '9' это то же самое, что hi = ch - 65 + 10 + 7;, которое hi = ch - 48 (это из-за 0xffffffff & 7).

Для 'A'.. 'F' это hi = ch - 65 + 10; (это из-за 0x00000000 & 7).

Для 'a'.. 'f' мы имеем большие числа, поэтому мы должны вычесть 32 из версии по умолчанию, сделав несколько бит 0 с помощью & 0x0f.

65 - это код для 'A'

48 - код для '0'

7 - количество букв между '9' и 'A' в таблице ASCII (...456789:;<=>?@ABCD...).

CoperNick 29 июль 2013, в 12:39

9

Это отличный пост. Мне нравится решение Waleed. Я не запускал его с помощью теста patridge, но, похоже, он довольно быстро. Мне также нужен обратный процесс, преобразовывая шестнадцатеричную строку в массив байтов, поэтому я написал ее как обращение к решению Waleed. Не уверен, что это быстрее, чем оригинальное решение Tomalak. Опять же, я не запускал обратный процесс через тест patridge.

private byte[] HexStringToByteArray(string hexString)
{
    int hexStringLength = hexString.Length;
    byte[] b = new byte[hexStringLength / 2];
    for (int i = 0; i < hexStringLength; i += 2)
    {
        int topChar = (hexString[i] > 0x40 ? hexString[i] - 0x37 : hexString[i] - 0x30) << 4;
        int bottomChar = hexString[i + 1] > 0x40 ? hexString[i + 1] - 0x37 : hexString[i + 1] - 0x30;
        b[i / 2] = Convert.ToByte(topChar + bottomChar);
    }
    return b;
}

Chris F 12 янв. 2010, в 17:29

0

В этом коде предполагается, что шестнадцатеричная строка использует буквенные символы верхнего регистра и взрывается, если шестнадцатеричная строка использует буквенные символы верхнего регистра Возможно, вы захотите сделать преобразование в верхнем регистре для входной строки, чтобы быть в безопасности.
Marc Novakowski 26 янв. 2010, в 19:17
0

Это проницательное наблюдение, Марк. Код был написан, чтобы полностью изменить решение Валида. Вызов ToUpper несколько замедлит алгоритм, но позволит обрабатывать строчные буквенные символы.
Chris F 26 янв. 2010, в 20:27
3

Convert.ToByte (topChar + bottomChar) можно записать как (байт) (topChar + bottomChar)
Amir Rezaei 12 фев. 2011, в 21:17
0

Чтобы обработать оба случая без значительного hexString[i] &= ~0x20; производительности, hexString[i] &= ~0x20;
Ben Voigt 31 июль 2014, в 22:31

Показать ещё 2 комментария

8

Почему это сложно? Это просто в Visual Studio 2008:

С#:

string hex = BitConverter.ToString(YourByteArray).Replace("-", "");

VB:

Dim hex As String = BitConverter.ToString(YourByteArray).Replace("-", "")

Craig Poulton 20 окт. 2010, в 01:06

2

причина в производительности, когда вам нужно высокопроизводительное решение. :)
Ricky 04 авг. 2016, в 06:28

7

Не собирать ответы на многие ответы здесь, но я нашел довольно оптимальную (~ 4,5 раза лучше, чем принято), прямую реализацию синтаксического анализа шестнадцатеричной строки. Во-первых, вывод из моих тестов (первая партия - это моя реализация):

Give me that string:
04c63f7842740c77e545bb0b2ade90b384f119f6ab57b680b7aa575a2f40939f

Time to parse 100,000 times: 50.4192 ms
Result as base64: BMY/eEJ0DHflRbsLKt6Qs4TxGfarV7aAt6pXWi9Ak58=
BitConverter'd: 04-C6-3F-78-42-74-0C-77-E5-45-BB-0B-2A-DE-90-B3-84-F1-19-F6-AB-5
7-B6-80-B7-AA-57-5A-2F-40-93-9F

Accepted answer: (StringToByteArray)
Time to parse 100000 times: 233.1264ms
Result as base64: BMY/eEJ0DHflRbsLKt6Qs4TxGfarV7aAt6pXWi9Ak58=
BitConverter'd: 04-C6-3F-78-42-74-0C-77-E5-45-BB-0B-2A-DE-90-B3-84-F1-19-F6-AB-5
7-B6-80-B7-AA-57-5A-2F-40-93-9F

With Mono implementation:
Time to parse 100000 times: 777.2544ms
Result as base64: BMY/eEJ0DHflRbsLKt6Qs4TxGfarV7aAt6pXWi9Ak58=
BitConverter'd: 04-C6-3F-78-42-74-0C-77-E5-45-BB-0B-2A-DE-90-B3-84-F1-19-F6-AB-5
7-B6-80-B7-AA-57-5A-2F-40-93-9F

With SoapHexBinary:
Time to parse 100000 times: 845.1456ms
Result as base64: BMY/eEJ0DHflRbsLKt6Qs4TxGfarV7aAt6pXWi9Ak58=
BitConverter'd: 04-C6-3F-78-42-74-0C-77-E5-45-BB-0B-2A-DE-90-B3-84-F1-19-F6-AB-5
7-B6-80-B7-AA-57-5A-2F-40-93-9F

Строки base64 и 'BitConverter'd' проверяются на правильность. Обратите внимание, что они равны.

Реализация:

public static byte[] ToByteArrayFromHex(string hexString)
{
  if (hexString.Length % 2 != 0) throw new ArgumentException("String must have an even length");
  var array = new byte[hexString.Length / 2];
  for (int i = 0; i < hexString.Length; i += 2)
  {
    array[i/2] = ByteFromTwoChars(hexString[i], hexString[i + 1]);
  }
  return array;
}

private static byte ByteFromTwoChars(char p, char p_2)
{
  byte ret;
  if (p <= '9' && p >= '0')
  {
    ret = (byte) ((p - '0') << 4);
  }
  else if (p <= 'f' && p >= 'a')
  {
    ret = (byte) ((p - 'a' + 10) << 4);
  }
  else if (p <= 'F' && p >= 'A')
  {
    ret = (byte) ((p - 'A' + 10) << 4);
  } else throw new ArgumentException("Char is not a hex digit: " + p,"p");

  if (p_2 <= '9' && p_2 >= '0')
  {
    ret |= (byte) ((p_2 - '0'));
  }
  else if (p_2 <= 'f' && p_2 >= 'a')
  {
    ret |= (byte) ((p_2 - 'a' + 10));
  }
  else if (p_2 <= 'F' && p_2 >= 'A')
  {
    ret |= (byte) ((p_2 - 'A' + 10));
  } else throw new ArgumentException("Char is not a hex digit: " + p_2, "p_2");

  return ret;
}

Я пробовал кое-что с unsafe и перемещал (явно избыточную) последовательность символов к nibble if другому методу, но это было самым быстрым из них.

(Я признаю, что это отвечает на половину вопроса. Я чувствовал, что преобразование string- > byte [] было недопредставлено, а байт [] → строковый угол кажется хорошо охваченным. Таким образом, этот ответ.)

Ben Mosher 22 май 2012, в 17:10

1

Для последователей Кнута: я сделал это, потому что мне нужно анализировать несколько тысяч шестнадцатеричных строк каждые несколько минут или около того, поэтому важно, чтобы это было как можно быстрее (как бы во внутреннем цикле). Решение Томалака не заметно медленнее, если много таких разборов не происходит.
Ben Mosher 22 май 2012, в 17:01

5

Безопасные версии:

public static class HexHelper
{
    [System.Diagnostics.Contracts.Pure]
    public static string ToHex(this byte[] value)
    {
        if (value == null)
            throw new ArgumentNullException("value");

        const string hexAlphabet = @"0123456789ABCDEF";

        var chars = new char[checked(value.Length * 2)];
        unchecked
        {
            for (int i = 0; i < value.Length; i++)
            {
                chars[i * 2] = hexAlphabet[value[i] >> 4];
                chars[i * 2 + 1] = hexAlphabet[value[i] & 0xF];
            }
        }
        return new string(chars);
    }

    [System.Diagnostics.Contracts.Pure]
    public static byte[] FromHex(this string value)
    {
        if (value == null)
            throw new ArgumentNullException("value");
        if (value.Length % 2 != 0)
            throw new ArgumentException("Hexadecimal value length must be even.", "value");

        unchecked
        {
            byte[] result = new byte[value.Length / 2];
            for (int i = 0; i < result.Length; i++)
            {
                // 0(48) - 9(57) -> 0 - 9
                // A(65) - F(70) -> 10 - 15
                int b = value[i * 2]; // High 4 bits.
                int val = ((b - '0') + ((('9' - b) >> 31) & -7)) << 4;
                b = value[i * 2 + 1]; // Low 4 bits.
                val += (b - '0') + ((('9' - b) >> 31) & -7);
                result[i] = checked((byte)val);
            }
            return result;
        }
    }
}

Небезопасные версии Для тех, кто предпочитает производительность и не боится непостоянства. Около 35% быстрее ToHex и на 10% быстрее FromHex.

public static class HexUnsafeHelper
{
    [System.Diagnostics.Contracts.Pure]
    public static unsafe string ToHex(this byte[] value)
    {
        if (value == null)
            throw new ArgumentNullException("value");

        const string alphabet = @"0123456789ABCDEF";

        string result = new string(' ', checked(value.Length * 2));
        fixed (char* alphabetPtr = alphabet)
        fixed (char* resultPtr = result)
        {
            char* ptr = resultPtr;
            unchecked
            {
                for (int i = 0; i < value.Length; i++)
                {
                    *ptr++ = *(alphabetPtr + (value[i] >> 4));
                    *ptr++ = *(alphabetPtr + (value[i] & 0xF));
                }
            }
        }
        return result;
    }

    [System.Diagnostics.Contracts.Pure]
    public static unsafe byte[] FromHex(this string value)
    {
        if (value == null)
            throw new ArgumentNullException("value");
        if (value.Length % 2 != 0)
            throw new ArgumentException("Hexadecimal value length must be even.", "value");

        unchecked
        {
            byte[] result = new byte[value.Length / 2];
            fixed (char* valuePtr = value)
            {
                char* valPtr = valuePtr;
                for (int i = 0; i < result.Length; i++)
                {
                    // 0(48) - 9(57) -> 0 - 9
                    // A(65) - F(70) -> 10 - 15
                    int b = *valPtr++; // High 4 bits.
                    int val = ((b - '0') + ((('9' - b) >> 31) & -7)) << 4;
                    b = *valPtr++; // Low 4 bits.
                    val += (b - '0') + ((('9' - b) >> 31) & -7);
                    result[i] = checked((byte)val);
                }
            }
            return result;
        }
    }
}

BTW Для тестового тестирования инициализация алфавита каждый раз, когда функция преобразования называется неправильной, алфавит должен быть const (для строки) или статическим readonly (для char []). Затем преобразование байт [] в алфавитном порядке в строку становится так же быстро, как версии манипулирования байтами.

И, конечно, тест должен быть скомпилирован в Release (с оптимизацией), а опция debug "Suppress JIT optimization" отключена (такая же для "Включить только мой код", если код должен быть отлаживаемым).

Maratius 20 дек. 2013, в 05:27

4

Обратная функция для кода Waleed Eissa (Hex String To Byte Array):

    public static byte[] HexToBytes(this string hexString)        
    {
        byte[] b = new byte[hexString.Length / 2];            
        char c;
        for (int i = 0; i < hexString.Length / 2; i++)
        {
            c = hexString[i * 2];
            b[i] = (byte)((c < 0x40 ? c - 0x30 : (c < 0x47 ? c - 0x37 : c - 0x57)) << 4);
            c = hexString[i * 2 + 1];
            b[i] += (byte)(c < 0x40 ? c - 0x30 : (c < 0x47 ? c - 0x37 : c - 0x57));
        }

        return b;
    }

Функция Waleed Eissa с поддержкой нижнего регистра:

    public static string BytesToHex(this byte[] barray, bool toLowerCase = true)
    {
        byte addByte = 0x37;
        if (toLowerCase) addByte = 0x57;
        char[] c = new char[barray.Length * 2];
        byte b;
        for (int i = 0; i < barray.Length; ++i)
        {
            b = ((byte)(barray[i] >> 4));
            c[i * 2] = (char)(b > 9 ? b + addByte : b + 0x30);
            b = ((byte)(barray[i] & 0xF));
            c[i * 2 + 1] = (char)(b > 9 ? b + addByte : b + 0x30);
        }

        return new string(c);
    }

Geograph 17 дек. 2015, в 12:55

3

От разработчиков Microsoft, приятное, простое преобразование:

public static string ByteArrayToString(byte[] ba) 
{
    // Concatenate the bytes into one long string
    return ba.Aggregate(new StringBuilder(32),
                            (sb, b) => sb.Append(b.ToString("X2"))
                            ).ToString();
}

В то время как вышеописанный чист, компактные, разработчики производительности будут кричать об этом с помощью счетчиков. Вы можете получить максимальную производительность с улучшенной версией оригинального ответа Tomolak:

public static string ByteArrayToString(byte[] ba)   
{   
   StringBuilder hex = new StringBuilder(ba.Length * 2);   

   for(int i=0; i < ga.Length; i++)       // <-- Use for loop is faster than foreach   
       hex.Append(ba[i].ToString("X2"));   // <-- ToString is faster than AppendFormat   

   return hex.ToString();   
}

Это самая быстрая из всех описанных здесь процедур. Не просто возьмите мое слово для этого... тест производительности каждой рутины и проверьте свой код CIL для себя.

Mark 29 сен. 2010, в 19:45

1

Итератор не является главной проблемой этого кода. Вы должны тестировать b.ToSting("X2") .
dolmen 20 авг. 2013, в 23:49

3

Методы расширения (отказ от ответственности: полностью непроверенный код, BTW...):

public static class ByteExtensions
{
    public static string ToHexString(this byte[] ba)
    {
        StringBuilder hex = new StringBuilder(ba.Length * 2);

        foreach (byte b in ba)
        {
            hex.AppendFormat("{0:x2}", b);
        }
        return hex.ToString();
    }
}

и т.д. Используйте любой из трех решений Tomalak (последний из них является методом расширения в строке).

Pure.Krome 22 нояб. 2008, в 14:03

0

Вам, вероятно, следует протестировать код, прежде чем предлагать его для такого вопроса.
jww 16 фев. 2017, в 19:08

2

Я войду в этот бит-фрид-турнир, так как у меня есть ответ, который также использует бит-скриптинг для декодирования шестнадцатеричных. Обратите внимание, что использование массивов символов может быть еще быстрее, поскольку вызов методов StringBuilder займет время.

public static String ToHex (byte[] data)
{
    int dataLength = data.Length;
    // pre-create the stringbuilder using the length of the data * 2, precisely enough
    StringBuilder sb = new StringBuilder (dataLength * 2);
    for (int i = 0; i < dataLength; i++) {
        int b = data [i];

        // check using calculation over bits to see if first tuple is a letter
        // isLetter is zero if it is a digit, 1 if it is a letter
        int isLetter = (b >> 7) & ((b >> 6) | (b >> 5)) & 1;

        // calculate the code using a multiplication to make up the difference between
        // a digit character and an alphanumerical character
        int code = '0' + ((b >> 4) & 0xF) + isLetter * ('A' - '9' - 1);
        // now append the result, after casting the code point to a character
        sb.Append ((Char)code);

        // do the same with the lower (less significant) tuple
        isLetter = (b >> 3) & ((b >> 2) | (b >> 1)) & 1;
        code = '0' + (b & 0xF) + isLetter * ('A' - '9' - 1);
        sb.Append ((Char)code);
    }
    return sb.ToString ();
}

public static byte[] FromHex (String hex)
{

    // pre-create the array
    int resultLength = hex.Length / 2;
    byte[] result = new byte[resultLength];
    // set validity = 0 (0 = valid, anything else is not valid)
    int validity = 0;
    int c, isLetter, value, validDigitStruct, validDigit, validLetterStruct, validLetter;
    for (int i = 0, hexOffset = 0; i < resultLength; i++, hexOffset += 2) {
        c = hex [hexOffset];

        // check using calculation over bits to see if first char is a letter
        // isLetter is zero if it is a digit, 1 if it is a letter (upper & lowercase)
        isLetter = (c >> 6) & 1;

        // calculate the tuple value using a multiplication to make up the difference between
        // a digit character and an alphanumerical character
        // minus 1 for the fact that the letters are not zero based
        value = ((c & 0xF) + isLetter * (-1 + 10)) << 4;

        // check validity of all the other bits
        validity |= c >> 7; // changed to >>, maybe not OK, use UInt?

        validDigitStruct = (c & 0x30) ^ 0x30;
        validDigit = ((c & 0x8) >> 3) * (c & 0x6);
        validity |= (isLetter ^ 1) * (validDigitStruct | validDigit);

        validLetterStruct = c & 0x18;
        validLetter = (((c - 1) & 0x4) >> 2) * ((c - 1) & 0x2);
        validity |= isLetter * (validLetterStruct | validLetter);

        // do the same with the lower (less significant) tuple
        c = hex [hexOffset + 1];
        isLetter = (c >> 6) & 1;
        value ^= (c & 0xF) + isLetter * (-1 + 10);
        result [i] = (byte)value;

        // check validity of all the other bits
        validity |= c >> 7; // changed to >>, maybe not OK, use UInt?

        validDigitStruct = (c & 0x30) ^ 0x30;
        validDigit = ((c & 0x8) >> 3) * (c & 0x6);
        validity |= (isLetter ^ 1) * (validDigitStruct | validDigit);

        validLetterStruct = c & 0x18;
        validLetter = (((c - 1) & 0x4) >> 2) * ((c - 1) & 0x2);
        validity |= isLetter * (validLetterStruct | validLetter);
    }

    if (validity != 0) {
        throw new ArgumentException ("Hexadecimal encoding incorrect for input " + hex);
    }

    return result;
}

Преобразован из Java-кода.

Maarten Bodewes 21 янв. 2014, в 00:19

0

Хм, я действительно должен оптимизировать это для Char[] и использовать Char внутри, а не в int ...
Maarten Bodewes 20 янв. 2014, в 23:46

2

Эта версия ByteArrayToHexViaByteManipulation может быть быстрее.

Из моих отчетов:

ByteArrayToHexViaByteManipulation3: 1,68 средних тика (более 1000 прогонов), 17,5X
ByteArrayToHexViaByteManipulation2: 1,73 средних тика (более 1000 прогонов), 16,9X
ByteArrayToHexViaByteManipulation: 2,90 средних тиков (более 1000 прогонов), 10,1X
ByteArrayToHexViaLookupAndShift: 3,22 средних тика (более 1000 прогонов), 9,1X

...

static private readonly char[] hexAlphabet = new char[]
    {'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'};
static string ByteArrayToHexViaByteManipulation3(byte[] bytes)
{
    char[] c = new char[bytes.Length * 2];
    byte b;
    for (int i = 0; i < bytes.Length; i++)
    {
        b = ((byte)(bytes[i] >> 4));
        c[i * 2] = hexAlphabet[b];
        b = ((byte)(bytes[i] & 0xF));
        c[i * 2 + 1] = hexAlphabet[b];
    }
    return new string(c);
}

И я думаю, что это оптимизация:

    static private readonly char[] hexAlphabet = new char[]
        {'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'};
    static string ByteArrayToHexViaByteManipulation4(byte[] bytes)
    {
        char[] c = new char[bytes.Length * 2];
        for (int i = 0, ptr = 0; i < bytes.Length; i++, ptr += 2)
        {
            byte b = bytes[i];
            c[ptr] = hexAlphabet[b >> 4];
            c[ptr + 1] = hexAlphabet[b & 0xF];
        }
        return new string(c);
    }

JoseH 23 авг. 2013, в 07:50

2

С точки зрения скорости это кажется лучше всего здесь:

  public static string ToHexString(byte[] data) {
    byte b;
    int i, j, k;
    int l = data.Length;
    char[] r = new char[l * 2];
    for (i = 0, j = 0; i < l; ++i) {
      b = data[i];
      k = b >> 4;
      r[j++] = (char)(k > 9 ? k + 0x37 : k + 0x30);
      k = b & 15;
      r[j++] = (char)(k > 9 ? k + 0x37 : k + 0x30);
    }
    return new string(r);
  }

Alexey Borzenkov 01 июнь 2010, в 09:21

2

Я не получил код, который ты предложил работать, Олипро. hex[i] + hex[i+1], очевидно, возвратил int.

Я сделал, однако имел некоторый успех, взяв некоторые подсказки от кода Waleeds и забивая это вместе. Это уродливо, как черт, но, похоже, работает и работает в 1/3 раза по сравнению с другими в соответствии с моими испытаниями (используя механизм тестирования патчей). В зависимости от размера ввода. Переключение между?: S, чтобы отделить 0-9 сначала, вероятно, даст немного более быстрый результат, поскольку число больше, чем буквы.

public static byte[] StringToByteArray2(string hex)
{
    byte[] bytes = new byte[hex.Length/2];
    int bl = bytes.Length;
    for (int i = 0; i < bl; ++i)
    {
        bytes[i] = (byte)((hex[2 * i] > 'F' ? hex[2 * i] - 0x57 : hex[2 * i] > '9' ? hex[2 * i] - 0x37 : hex[2 * i] - 0x30) << 4);
        bytes[i] |= (byte)(hex[2 * i + 1] > 'F' ? hex[2 * i + 1] - 0x57 : hex[2 * i + 1] > '9' ? hex[2 * i + 1] - 0x37 : hex[2 * i + 1] - 0x30);
    }
    return bytes;
}

Fredrik Hu 22 май 2010, в 23:12

1

Другим способом является использование stackalloc для уменьшения давления памяти ГХ:

static string ByteToHexBitFiddle(byte[] bytes)
{
        var c = stackalloc char[bytes.Length * 2 + 1];
        int b; 
        for (int i = 0; i < bytes.Length; ++i)
        {
            b = bytes[i] >> 4;
            c[i * 2] = (char)(55 + b + (((b - 10) >> 31) & -7));
            b = bytes[i] & 0xF;
            c[i * 2 + 1] = (char)(55 + b + (((b - 10) >> 31) & -7));
        }
        c[bytes.Length * 2 ] = '\0';
        return new string(c);
}

Kel 20 май 2016, в 16:46

1

Другая быстрая функция...

private static readonly byte[] HexNibble = new byte[] {
    0x0, 0x1, 0x2, 0x3, 0x4, 0x5, 0x6, 0x7,
    0x8, 0x9, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
    0x0, 0xA, 0xB, 0xC, 0xD, 0xE, 0xF, 0x0,
    0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
    0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
    0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
    0x0, 0xA, 0xB, 0xC, 0xD, 0xE, 0xF
};

public static byte[] HexStringToByteArray( string str )
{
    int byteCount = str.Length >> 1;
    byte[] result = new byte[byteCount + (str.Length & 1)];
    for( int i = 0; i < byteCount; i++ )
        result[i] = (byte) (HexNibble[str[i << 1] - 48] << 4 | HexNibble[str[(i << 1) + 1] - 48]);
    if( (str.Length & 1) != 0 )
        result[byteCount] = (byte) HexNibble[str[str.Length - 1] - 48];
    return result;
}

spacepille 22 сен. 2013, в 01:24

1

Не оптимизирован для скорости, но больше LINQy, чем большинство ответов (.NET 4.0):

<Extension()>
Public Function FromHexToByteArray(hex As String) As Byte()
    hex = If(hex, String.Empty)
    If hex.Length Mod 2 = 1 Then hex = "0" & hex
    Return Enumerable.Range(0, hex.Length \ 2).Select(Function(i) Convert.ToByte(hex.Substring(i * 2, 2), 16)).ToArray
End Function

<Extension()>
Public Function ToHexString(bytes As IEnumerable(Of Byte)) As String
    Return String.Concat(bytes.Select(Function(b) b.ToString("X2")))
End Function

MCattle 31 авг. 2013, в 01:38

1

Вот мой выстрел в него. Я создал пару классов расширения для расширения строки и байта. В большом пробном файле производительность сопоставима с Byte Manipulation 2.

Код ниже для ToHexString - это оптимизированная реализация алгоритма поиска и сдвига. Он почти идентичен файлу Behrooz, но он получается с помощью foreach для итерации, а счетчик быстрее, чем явно индексирование for.

Он входит в 2-е место позади Byte Manipulation 2 на моей машине и является очень читаемым кодом. Интересны также следующие результаты испытаний:

ToHexStringCharArrayWithCharArrayLookup: 41,589.69 средних тиков (более 1000 прогонов), 1.5X ToHexStringCharArrayWithStringLookup: 50 764,06 средний тик (более 1000 прогонов), 1.2X ToHexStringStringBuilderWithCharArrayLookup: 62,812.87 средних тиков (более 1000 прогонов), 1.0X

Основываясь на приведенных выше результатах, кажется безопасным заключить, что:

Штрафы за индексацию в строку для выполнения поиска по сравнению с Массив char значителен для большого теста файлов.
Штрафы за использование StringBuilder известной емкости против char массив известного размера для создания строки еще более значителен.

Здесь код:

using System;

namespace ConversionExtensions
{
    public static class ByteArrayExtensions
    {
        private readonly static char[] digits = new char[] { '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'A', 'B', 'C', 'D', 'E', 'F' };

        public static string ToHexString(this byte[] bytes)
        {
            char[] hex = new char[bytes.Length * 2];
            int index = 0;

            foreach (byte b in bytes)
            {
                hex[index++] = digits[b >> 4];
                hex[index++] = digits[b & 0x0F];
            }

            return new string(hex);
        }
    }
}


using System;
using System.IO;

namespace ConversionExtensions
{
    public static class StringExtensions
    {
        public static byte[] ToBytes(this string hexString)
        {
            if (!string.IsNullOrEmpty(hexString) && hexString.Length % 2 != 0)
            {
                throw new FormatException("Hexadecimal string must not be empty and must contain an even number of digits to be valid.");
            }

            hexString = hexString.ToUpperInvariant();
            byte[] data = new byte[hexString.Length / 2];

            for (int index = 0; index < hexString.Length; index += 2)
            {
                int highDigitValue = hexString[index] <= '9' ? hexString[index] - '0' : hexString[index] - 'A' + 10;
                int lowDigitValue = hexString[index + 1] <= '9' ? hexString[index + 1] - '0' : hexString[index + 1] - 'A' + 10;

                if (highDigitValue < 0 || lowDigitValue < 0 || highDigitValue > 15 || lowDigitValue > 15)
                {
                    throw new FormatException("An invalid digit was encountered. Valid hexadecimal digits are 0-9 and A-F.");
                }
                else
                {
                    byte value = (byte)((highDigitValue << 4) | (lowDigitValue & 0x0F));
                    data[index / 2] = value;
                }
            }

            return data;
        }
    }
}

Ниже приведены результаты тестов, которые я получил, когда я поместил свой код в проект тестирования @patridge на моей машине. Я также добавил тест для преобразования в массив байтов из шестнадцатеричного. Тесты, которые выполняли мой код, - это ByteArrayToHexViaOptimizedLookupAndShift и HexToByteArrayViaByteManipulation. HexToByteArrayViaConvertToByte был взят из XXXX. HexToByteArrayViaSoapHexBinary - это ответ от ответа @Mykroft.

Процессор Intel Pentium III Xeon
    Cores: 4 <br/>
    Current Clock Speed: 1576 <br/>
    Max Clock Speed: 3092 <br/>
Преобразование массива байтов в шестнадцатеричное представление строки

ByteArrayToHexViaByteManipulation2: 39 366,64 средних тика (более 1000 прогонов), 22,4X

ByteArrayToHexViaOptimizedLookupAndShift: 41 588,64 средних тика (более 1000 прогонов), 21,2X

ByteArrayToHexViaLookup: 55 509,56 средних тиков (более 1000 прогонов), 15,9X

ByteArrayToHexViaByteManipulation: 65,349.12 средних тиков (более 1000 прогонов), 13,5X

ByteArrayToHexViaLookupAndShift: 86,926.87 средних тиков (более 1000 работает), 10.2X

ByteArrayToHexStringViaBitConverter: 139,353.73 в среднем тики (более 1000 прогонов), 6.3X

ByteArrayToHexViaSoapHexBinary: 314 598,77 средних тиков (более 1000 прогонов), 2,8X

ByteArrayToHexStringViaStringBuilderForEachByteToString: 344,264.63 средний тик (более 1000 прогонов), 2,6X

ByteArrayToHexStringViaStringBuilderAggregateByteToString: 382 623,44 средний тик (более 1000 прогонов), 2.3X

ByteArrayToHexStringViaStringBuilderForEachAppendFormat: 818,111.95 средний тик (более 1000 прогонов), 1.1X

ByteArrayToHexStringViaStringConcatArrayConvertAll: 839,244.84 в среднем тики (более 1000 прогонов), 1.1X

ByteArrayToHexStringViaStringBuilderAggregateAppendFormat: 867,303.98 средний тик (более 1000 прогонов), 1.0X

ByteArrayToHexStringViaStringJoinArrayConvertAll: 882 710,28 в среднем тики (более 1000 прогонов), 1.0X

JamieSee 03 июнь 2013, в 23:44

1

Два mashups, которые складывают две операции полубайта в один.

Вероятно, довольно эффективная версия:

public static string ByteArrayToString2(byte[] ba)
{
    char[] c = new char[ba.Length * 2];
    for( int i = 0; i < ba.Length * 2; ++i)
    {
        byte b = (byte)((ba[i>>1] >> 4*((i&1)^1)) & 0xF);
        c[i] = (char)(55 + b + (((b-10)>>31)&-7));
    }
    return new string( c );
}

Декадентская версия linq-with-bit-hacking:

public static string ByteArrayToString(byte[] ba)
{
    return string.Concat( ba.SelectMany( b => new int[] { b >> 4, b & 0xF }).Select( b => (char)(55 + b + (((b-10)>>31)&-7))) );
}

И наоборот:

public static byte[] HexStringToByteArray( string s )
{
    byte[] ab = new byte[s.Length>>1];
    for( int i = 0; i < s.Length; i++ )
    {
        int b = s[i];
        b = (b - '0') + ((('9' - b)>>31)&-7);
        ab[i>>1] |= (byte)(b << 4*((i&1)^1));
    }
    return ab;
}

JJJ 15 май 2013, в 13:48

1

HexStringToByteArray ("09") возвращает 0x02, что плохо
CoperNick 29 июль 2013, в 10:26

1

Еще одно изменение для разнообразия:

public static byte[] FromHexString(string src)
{
    if (String.IsNullOrEmpty(src))
        return null;

    int index = src.Length;
    int sz = index / 2;
    if (sz <= 0)
        return null;

    byte[] rc = new byte[sz];

    while (--sz >= 0)
    {
        char lo = src[--index];
        char hi = src[--index];

        rc[sz] = (byte)(
            (
                (hi >= '0' && hi <= '9') ? hi - '0' :
                (hi >= 'a' && hi <= 'f') ? hi - 'a' + 10 :
                (hi >= 'A' && hi <= 'F') ? hi - 'A' + 10 :
                0
            )
            << 4 | 
            (
                (lo >= '0' && lo <= '9') ? lo - '0' :
                (lo >= 'a' && lo <= 'f') ? lo - 'a' + 10 :
                (lo >= 'A' && lo <= 'F') ? lo - 'A' + 10 :
                0
            )
        );
    }

    return rc;          
}

Stas Makutin 16 июнь 2011, в 22:26

1

Для производительности я бы пошел с раствором drphrozens. Крошечной оптимизацией для декодера может быть использование таблицы для char, чтобы избавиться от "< 4".

Очевидно, что два вызова метода являются дорогостоящими. Если какая-либо проверка выполняется либо на входных, либо на выходных данных (может быть CRC, контрольная сумма или что-то еще), можно было бы пропустить if (b == 255)... и тем самым также вызвать метод вообще.

Использование offset++ и offset вместо offset и offset + 1 может дать некоторую теоретическую выгоду, но я подозреваю, что компилятор справляется с этим лучше меня.

private static readonly byte[] LookupTableLow = new byte[] {
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0x00, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 0x08, 0x09, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x0F, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x0F, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF
};

private static readonly byte[] LookupTableHigh = new byte[] {
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0x00, 0x10, 0x20, 0x30, 0x40, 0x50, 0x60, 0x70, 0x80, 0x90, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xA0, 0xB0, 0xC0, 0xD0, 0xE0, 0xF0, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xA0, 0xB0, 0xC0, 0xD0, 0xE0, 0xF0, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF
};

private static byte LookupLow(char c)
{
  var b = LookupTableLow[c];
  if (b == 255)
    throw new IOException("Expected a hex character, got " + c);
  return b;
}

private static byte LookupHigh(char c)
{
  var b = LookupTableHigh[c];
  if (b == 255)
    throw new IOException("Expected a hex character, got " + c);
  return b;
}

public static byte ToByte(char[] chars, int offset)
{
  return (byte)(LookupHigh(chars[offset++]) | LookupLow(chars[offset]));
}

Это просто с головы до головы и не тестировалось или сравнивалось.

ClausAndersen 08 июнь 2011, в 08:19

1

И для вставки в строку SQL (если вы не используете параметры команды):

public static String ByteArrayToSQLHexString(byte[] Source)
{
    return = "0x" + BitConverter.ToString(Source).Replace("-", "");
}

Jack Straw 14 сен. 2009, в 21:18

0

Основное решение с поддержкой расширения

public static class Utils
{
    public static byte[] ToBin(this string hex)
    {
        int NumberChars = hex.Length;
        byte[] bytes = new byte[NumberChars / 2];
        for (int i = 0; i < NumberChars; i += 2)
            bytes[i / 2] = Convert.ToByte(hex.Substring(i, 2), 16);
        return bytes;
    }
    public static string ToHex(this byte[] ba)
    {
        return  BitConverter.ToString(ba).Replace("-", "");
    }
}

И используйте этот класс, как показано ниже.

    byte[] arr1 = new byte[] { 1, 2, 3 };
    string hex1 = arr1.ToHex();
    byte[] arr2 = hex1.ToBin();

cahit beyaz 14 май 2018, в 14:03

0

static string ByteArrayToHexViaLookupPerByte2(byte[] bytes)
{                
        var result3 = new uint[bytes.Length];
        for (int i = 0; i < bytes.Length; i++)
                result3[i] = _Lookup32[bytes[i]];
        var handle = GCHandle.Alloc(result3, GCHandleType.Pinned);
        try
        {
                var result = Marshal.PtrToStringUni(handle.AddrOfPinnedObject(), bytes.Length * 2);
                return result;
        }
        finally
        {
                handle.Free();
        }
}

Эти функции в моих тестах всегда являются второй записью после небезопасной реализации.

К сожалению, тестовый стенд не так надежен... если вы запустите его несколько раз, список перетасовывается настолько, что кто знает после небезопасного, который действительно самый быстрый! Он не учитывает предварительное прогревание, время компиляции jit и результаты производительности GC. Я хотел бы переписать его, чтобы получить больше информации, но у меня не было на это времени.

Tommaso Ercole 02 май 2017, в 13:01

0

Ниже раскрывается отличный ответ здесь, разрешив собственный вариант с нижним регистром, а также обрабатывая нулевой или пустой ввод и делая это методом расширения.

    /// <summary>
    /// Converts the byte array to a hex string very fast. Excellent job
    /// with code lightly adapted from 'community wiki' here: /questions/10949/how-do-you-convert-a-byte-array-to-a-hexadecimal-string-and-vice-versa/73922#73922
    /// (the function was originally named: ByteToHexBitFiddle). Now allows a native lowerCase option
    /// to be input and allows null or empty inputs (null returns null, empty returns empty).
    /// </summary>
    public static string ToHexString(this byte[] bytes, bool lowerCase = false)
    {
        if (bytes == null)
            return null;
        else if (bytes.Length == 0)
            return "";

        char[] c = new char[bytes.Length * 2];

        int b;
        int xAddToAlpha = lowerCase ? 87 : 55;
        int xAddToDigit = lowerCase ? -39 : -7;

        for (int i = 0; i < bytes.Length; i++) {

            b = bytes[i] >> 4;
            c[i * 2] = (char)(xAddToAlpha + b + (((b - 10) >> 31) & xAddToDigit));

            b = bytes[i] & 0xF;
            c[i * 2 + 1] = (char)(xAddToAlpha + b + (((b - 10) >> 31) & xAddToDigit));
        }

        string val = new string(c);
        return val;
    }

    public static string ToHexString(this IEnumerable<byte> bytes, bool lowerCase = false)
    {
        if (bytes == null)
            return null;
        byte[] arr = bytes.ToArray();
        return arr.ToHexString(lowerCase);
    }

Nicholas Petersen 20 окт. 2015, в 22:51

0

Существует также XmlWriter.WriteBinHex (см. Страницу MSDN). Это очень полезно, если вам нужно поместить шестнадцатеричную строку в поток XML.

Вот отдельный метод, чтобы увидеть, как он работает:

    public static string ToBinHex(byte[] bytes)
    {
        XmlWriterSettings xmlWriterSettings = new XmlWriterSettings();
        xmlWriterSettings.ConformanceLevel = ConformanceLevel.Fragment;
        xmlWriterSettings.CheckCharacters = false;
        xmlWriterSettings.Encoding = ASCIIEncoding.ASCII;
        MemoryStream memoryStream = new MemoryStream();
        using (XmlWriter xmlWriter = XmlWriter.Create(memoryStream, xmlWriterSettings))
        {
            xmlWriter.WriteBinHex(bytes, 0, bytes.Length);
        }
        return Encoding.ASCII.GetString(memoryStream.ToArray());
    }

astrada 24 окт. 2013, в 09:57

0

Я думаю, его скорость стоит 16 дополнительных байтов.

    static char[] hexes = new char[]{'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'};
    public static string ToHexadecimal (this byte[] Bytes)
    {
        char[] Result = new char[Bytes.Length << 1];
        int Offset = 0;
        for (int i = 0; i != Bytes.Length; i++) {
            Result[Offset++] = hexes[Bytes[i] >> 4];
            Result[Offset++] = hexes[Bytes[i] & 0x0F];
        }
        return new string(Result);
    }

Behrooz 16 дек. 2012, в 22:27

2

Это на самом деле медленнее, чем другие подходы, основанные на поиске таблиц (по крайней мере, в моих тестах). Использование != Вместо < нарушает некоторые шаблоны оптимизации JIT, и дополнительный счетчик для Offset кажется дорогостоящим.
CodesInChaos 15 янв. 2013, в 09:32

0

Это работает, чтобы перейти от строки к массиву байтов...

public static byte[] StrToByteArray(string str)
    {
        Dictionary<string, byte> hexindex = new Dictionary<string, byte>();
        for (byte i = 0; i < 255; i++)
            hexindex.Add(i.ToString("X2"), i);

        List<byte> hexres = new List<byte>();
        for (int i = 0; i < str.Length; i += 2)
            hexres.Add(hexindex[str.Substring(i, 2)]);

        return hexres.ToArray();
    }

Rick 25 май 2012, в 17:47

0

Если производительность имеет значение, здесь оптимизированное решение:

    static readonly char[] _hexDigits = "0123456789abcdef".ToCharArray();
    public static string ToHexString(this byte[] bytes)
    {
        char[] digits = new char[bytes.Length * 2];
        for (int i = 0; i < bytes.Length; i++)
        {
            int d1, d2;
            d1 = Math.DivRem(bytes[i], 16, out d2);
            digits[2 * i] = _hexDigits[d1];
            digits[2 * i + 1] = _hexDigits[d2];
        }
        return new string(digits);
    }

Это примерно в 2,5 раза быстрее, чем BitConverter.ToString, и примерно в 7 раз быстрее, чем BitConverter.ToString + удаление символов "-".

Thomas Levesque 10 апр. 2011, в 02:39

4

Если производительность имеет значение, вы бы не использовали Math.DivRem для разделения байта на два куска.
dolmen 20 авг. 2013, в 23:53
0

@ dolmen, ты тестировал производительность с Math.DivRem и без Math.DivRem ? Я серьезно сомневаюсь, что это как- то влияет на производительность: реализация Math.DivRem - это именно то, что вы бы делали вручную, а метод очень прост, поэтому он всегда встроен в JIT (на самом деле он предназначен для встраивания, как предложено в TargetedPatchingOptOut Атрибут применяется к нему)
Thomas Levesque 21 авг. 2013, в 00:12
1

@ThomasLevesque Реализация DivRem выполняет операцию модуля и деление. Почему вы предполагаете, что эти операции именно то, что вы бы сделали вручную? Для меня естественной реализацией является github.com/patridge/PerformanceStubs/blob/master/…, которая выполняет сдвиг битов, а также логическое и. Эти операции намного дешевле, чем модуль и деление даже на современных процессорах.
Søren Boisen 03 авг. 2016, в 16:08

Показать ещё 1 комментарий

0

Если вы хотите получить "увеличение скорости 4 раза", сообщенное wcoenen, тогда, если это не очевидно: замените hex.Substring(i, 2) на hex[i]+hex[i+1]

Вы также можете сделать еще один шаг и избавиться от i+=2, используя i++ в обоих местах.

Olipro 02 янв. 2010, в 23:29

-4

Я подозреваю, что скорость этого будет сбивать носки с большинства других тестов...

Public Function BufToHex(ByVal buf() As Byte) As String
    Dim sB As New System.Text.StringBuilder
    For i As Integer = 0 To buf.Length - 1
        sB.Append(buf(i).ToString("x2"))
    Next i
    Return sB.ToString
End Function

John Craig 27 окт. 2011, в 04:09

2

Что заставляет вас думать, что? Вы создаете новый строковый объект для каждого байта в буфере, и вы не предварительно определяете размер строителя строк (что может привести к многократному изменению размера буфера в больших массивах).
Brian Reichle 02 дек. 2011, в 13:50
0

Обычное английское преобразование байтов :)
Behrooz 16 дек. 2012, в 21:44

Ещё вопросы

Принятый ниже ответ, по-видимому, выделяет ужасное количество строк в преобразовании строки в байты. Мне интересно, как это влияет на производительность
Класс SoapHexBinary делает именно то, что вы хотите, я думаю.
Не могли бы вы проверить код из ответа Валида? Вроде бы очень быстро. stackoverflow.com/questions/311165/...
Несмотря на то, что я сделал код доступным для вас, чтобы сделать то, что вы сами запросили, я обновил код тестирования, включив в него ответ Waleed. Не говоря о раздражительности, это намного быстрее.
Я получил другой результат, когда я использовал «ByteArrayToHexStringViaBitConverter» и «ByteArrayToHexStringViaStringBuilder». Последний оказался «правильным». Есть ли какая-то причина, по которой результат двух функций должен быть разным?
Если это все еще происходит, лучшее, что я могу догадаться на данный момент, - это какая-то разновидность системной культуры, которая влияет на результаты.
Можете ли вы добавить мое решение? В моем тесте это было примерно на 25% быстрее, чем ByteArrayToHexViaByteManipulation
@CodesInChaos Готово. И в моих тестах он тоже немного выиграл. Я не претендую на то, чтобы полностью понять ни один из лучших методов, но они легко скрыты от прямого взаимодействия.
Начиная с C # 4 (VS2010), наиболее естественным является String.Concat(bytes.Select(b => b.ToString("X2"))) . Обратите внимание, что мы не выделяем и не копируем во весь новый временный массив, как с Array.ConvertAll<> . Это решение было также дано @AllonGuralnek в комментарии к ответу Уилла Дина. Я думаю, мы можем согласиться, что люди будут использовать LINQ Select настоящее время.
Этот ответ не намерен отвечать на вопрос о том, что является «естественным» или обычным явлением. Цель состоит в том, чтобы дать людям некоторые базовые показатели производительности, поскольку, когда вам нужно выполнить это преобразование, вы склонны делать их много. Если кому-то нужна грубая скорость, он просто запускает тесты с соответствующими тестовыми данными в нужной им вычислительной среде. Затем уберите этот метод в метод расширения, где вы никогда больше не посмотрите его реализацию (например, bytes.ToHexStringAtLudicrousSpeed() ).
Попробуйте этот ответ: stackoverflow.com/a/5919521/356218 В моих тестах производительности (где-то на этом ответе) он немного быстрее, чем ByteArrayToHexViaByteManipulation но гораздо более чистый код
Я поместил его в структуру тестирования и дал запустить. Это, безусловно, достаточно быстро, чтобы люди могли использовать их в своих целях, хотя в тестах это не было лидерством.
@CodesInChaos У меня есть реализация "bit fiddle", использующая один цикл для декодирования шестнадцатеричной строки. Хотите проверить? Блин за Коды за то, что я избил меня до мелочей: P
Только что произвел реализацию на основе высокоэффективной таблицы поиска. Его безопасный вариант примерно на 30% быстрее, чем текущий лидер на моем процессоре. Небезопасные варианты еще быстрее. stackoverflow.com/a/24343727/445517
@CodesInChaos Определенно быстрее в этой глупой среде тестирования, которую я собрал для этого ответа. Я обновил ответ и тестовый каркас репо. Я только добавил безопасный вариант, так что вы, вероятно, имеете эту ужасную скорость с этой небезопасной версией Отлично сделано, сэр.
Только что понял, что unsafe таблица поиска в тесте производительности верна только тогда, когда BitConverter.IsLittleEndian ( msdn.microsoft.com/en-us/library/… ) имеет значение true. @CodesInChaos оригинальный код обрабатывает это правильно. Не большая проблема, но у вас это есть.
Спасибо, @JoeAmenta. Я подал ошибку в репозитории проекта, чтобы напомнить мне, чтобы исправить это. Не смотря на это слишком много прямо сейчас, похоже, что это должно быть достаточно просто, учитывая пример CodesInChaos.
Обнаружена ошибка в ByteArrayToHexViaLookupPerByte вызывающая исключение IndexOutOfRangeException: массив _Lookup32 должен содержать 256 элементов, а не 255. Например, попробуйте выполнить ByteArrayToHexViaLookupPerByte(new byte[] { 255 })
Отличный ответ. Я использовал второй вариант в вашем списке результатов stackoverflow.com/a/24343727/48700 и протестировал его с помощью веб-сокета SignalR для трансляции изображений слушателям без использования каких-либо файлов. На стороне javascript: var src = 'data: image / jpeg; base64,' + hexToBase64 (binimage); $ ("# aha"). attr ("src", src);
@Goodies Я обнаружил, что простой Convert.ToBase64String () ОЧЕНЬ быстр (быстрее, чем байт Lookup (через CodesInChaos)) в моем тестировании - так что, если кто-то не заботится о шестнадцатеричном выводе, это быстрый замена линии.
@CodesInChaos отличная функция манипулирования байтами, спасибо!
SoapHexBinary доступен в .NET 1.0 и находится в mscorlib. Несмотря на смешное пространство имен, он выполняет именно то, что задал вопрос.
Отличная находка! Обратите внимание, что вам нужно дополнить нечетные строки начальным 0 для GetStringToBytes, как и в другом решении.
Вы видели реализацию мысли? Принятый ответ имеет лучшее ИМХО.
Вы имеете в виду реализацию SoapHexBinary? Если так, что он делает, что делает его хуже, чем реализация в принятом ответе?
Интересно увидеть реализацию Mono здесь: github.com/mono/mono/blob/master/mcs/class/corlib/…
В моих тестах (которые я собираюсь добавить в ответ), Моно импл. примерно на 10% быстрее, чем SoapHexBinary , и в 16 раз медленнее, чем у меня ...
+1 за правильное цитирование вашего источника после вызова этого чёрного волшебства. Приветствую Ктулху.
Лучший ответ (для шестнадцатеричной части вопроса)!
Что я хотел сказать, если у меня есть «0x1B», как я могу преобразовать это в байт?
Ницца! Для тех, кому нужен строчный вывод, выражение явно меняется на 87 + b + (((b-10)>>31)&-39)
Теперь я получил его в Java и C # для кодирования и декодирования, чтобы показать мою «темную магию» (один цикл, без ветвей, кроме последнего за шестнадцатеричные ошибки). Отдельно от вашего краткого кода, конечно, я иногда люблю ломать голову.
@ Ааа, ты хочешь преобразовать его в массив байтовых массивов? ;)
@CoolOppo, я не уверен, что вы имеете в виду, но шестнадцатеричная строка имеет формат "123456789ABCDEF" , означая, что каждые два символа преобразуются в one byte
@AaA Вы сказали « byte[] array », что буквально означает массив байтовых массивов или byte[][] . Я просто подшучивал.
Почему бы просто не использовать 'A'-0xA вместо 55 ? Позвольте компилятору понять это; магические числа, такие как 55 , не всегда понятны людям и подвержены ошибкам.
@DavidRTribble Потому что я не хочу брать на себя венок Великого Лорда Ктулху.
@CodesInChaos - я знаю, что ты имел в виду гнев . Но видите, это проблема с 101 символом, который я, конечно, написал бы как 'e' . ;-)
Еще короче: String.Concat (Array.ConvertAll (bytes, x => x.ToString ("X2"))
Просто обратите внимание, что хорошая техника maxc нуждается в .net 4.0
Еще короче: String.Concat (bytes.Select (b => b.ToString ("X2"))) [.NET4]
Только отвечает на половину вопроса.
Зачем второму нужен .Net 4? String.Concat находится в .Net 2.0.
эти петли в стиле «90-х», как правило, быстрее, но на ничтожно малое количество, что не имеет значения в большинстве случаев. Стоит упомянуть, хотя
Только отвечает на половину вопроса.
Почему при создании таблицы поиска в небезопасной версии меняются кусочки предварительно вычисленного байта? Я думал, что порядок байтов только изменил порядок объектов, которые были сформированы из нескольких байтов.
@RaifAtef Здесь важен не порядок грызунов. Но порядка 16 битных слов в 32-битном целом числе. Но я подумываю переписать его, чтобы один и тот же код мог выполняться независимо от порядка байтов.
Перечитывая код, я думаю, что вы сделали это, потому что когда вы приводите char * позже к uint * и присваиваете его (при генерации шестнадцатеричного char), среда выполнения / CPU переворачивают байты (поскольку uint не обрабатывается то же самое, что 2 отдельных 16-битных символа), поэтому вы предварительно переворачиваете их для компенсации. Я прав ? Endianness сбивает с толку :-).
Хорошо, я _lookup32Unsafe - какое преимущество в том, чтобы бесконечно закреплять _lookup32Unsafe вместо того, чтобы просто делать третий fixed оператор и позволять GC перемещать массив в соответствии с его содержанием, когда этот метод не работает?
@JoeAmenta Не уверен, есть ли какое-либо измеримое преимущество в этом случае. Возможно, я просто не думал об этой альтернативе, когда писал этот код.
Это просто ответ на половину вопроса ... Как насчет шестнадцатеричной строки в байтах?
Почему только небезопасный вариант проверяет порядок байтов? Первый пример, кажется, просто предполагает, что машина - маленький индийский.
@TamaMcGlinn Безопасная реализация использует little-endian для своего внутреннего представления, но не делает предположений о машинном порядке. Так что он все равно должен работать на машинах с прямым порядком байтов (возможно, немного медленнее). В отличие от этого небезопасный вариант повторно интерпретирует два 16-битных слова как одно 32-битное слово, поэтому он должен быть осторожен с порядком байтов хоста.
не говоря уже о том, что для этого используется меньше всего памяти. Никаких промежуточных строк не создано.
Только отвечает на половину вопроса.
Это здорово, потому что он работает практически на любой версии NET, включая NETMF. Победитель!
Принятый ответ предоставляет 2 превосходных метода HexToByteArray, которые представляют другую половину вопроса. Решение Waleed отвечает на вопрос о том, как это сделать, не создавая огромное количество строк в процессе.
Копирует и перераспределяет ли новая строка (c) или она достаточно умна, чтобы знать, когда она может просто обернуть символ []?
@PsychoDad, он копирует. Строка должна быть неизменной, в то время как char [] может измениться после создания строки.
@SlyGryphon На самом деле, если вы прокрутите вниз от упомянутого поста на форуме, я фактически предоставил другую сторону того, что было обновлено здесь: stackoverflow.com/a/22158486/278889
Использование памяти в 256 байтов незначительно при запуске кода в CLR.
В этом коде предполагается, что шестнадцатеричная строка использует буквенные символы верхнего регистра и взрывается, если шестнадцатеричная строка использует буквенные символы верхнего регистра Возможно, вы захотите сделать преобразование в верхнем регистре для входной строки, чтобы быть в безопасности.
Это проницательное наблюдение, Марк. Код был написан, чтобы полностью изменить решение Валида. Вызов ToUpper несколько замедлит алгоритм, но позволит обрабатывать строчные буквенные символы.
Convert.ToByte (topChar + bottomChar) можно записать как (байт) (topChar + bottomChar)
Чтобы обработать оба случая без значительного hexString[i] &= ~0x20; производительности, hexString[i] &= ~0x20;
причина в производительности, когда вам нужно высокопроизводительное решение. :)
Для последователей Кнута: я сделал это, потому что мне нужно анализировать несколько тысяч шестнадцатеричных строк каждые несколько минут или около того, поэтому важно, чтобы это было как можно быстрее (как бы во внутреннем цикле). Решение Томалака не заметно медленнее, если много таких разборов не происходит.
Итератор не является главной проблемой этого кода. Вы должны тестировать b.ToSting("X2") .
Вам, вероятно, следует протестировать код, прежде чем предлагать его для такого вопроса.
Хм, я действительно должен оптимизировать это для Char[] и использовать Char внутри, а не в int ...
HexStringToByteArray ("09") возвращает 0x02, что плохо
Это на самом деле медленнее, чем другие подходы, основанные на поиске таблиц (по крайней мере, в моих тестах). Использование != Вместо < нарушает некоторые шаблоны оптимизации JIT, и дополнительный счетчик для Offset кажется дорогостоящим.
Если производительность имеет значение, вы бы не использовали Math.DivRem для разделения байта на два куска.
@ dolmen, ты тестировал производительность с Math.DivRem и без Math.DivRem ? Я серьезно сомневаюсь, что это как- то влияет на производительность: реализация Math.DivRem - это именно то, что вы бы делали вручную, а метод очень прост, поэтому он всегда встроен в JIT (на самом деле он предназначен для встраивания, как предложено в TargetedPatchingOptOut Атрибут применяется к нему)
@ThomasLevesque Реализация DivRem выполняет операцию модуля и деление. Почему вы предполагаете, что эти операции именно то, что вы бы сделали вручную? Для меня естественной реализацией является github.com/patridge/PerformanceStubs/blob/master/…, которая выполняет сдвиг битов, а также логическое и. Эти операции намного дешевле, чем модуль и деление даже на современных процессорах.
Что заставляет вас думать, что? Вы создаете новый строковый объект для каждого байта в буфере, и вы не предварительно определяете размер строителя строк (что может привести к многократному изменению размера буфера в больших массивах).
Обычное английское преобразование байтов :)

Tomalak · Accepted Answer · 2008-11-22T12-14-00.000Z

1126

Лучший ответ

Или:

public static string ByteArrayToString(byte[] ba)
{
  StringBuilder hex = new StringBuilder(ba.Length * 2);
  foreach (byte b in ba)
    hex.AppendFormat("{0:x2}", b);
  return hex.ToString();
}

или же:

public static string ByteArrayToString(byte[] ba)
{
  return BitConverter.ToString(ba).Replace("-","");
}

Здесь есть еще больше вариантов, например здесь.

Обратное преобразование будет выглядеть следующим образом:

public static byte[] StringToByteArray(String hex)
{
  int NumberChars = hex.Length;
  byte[] bytes = new byte[NumberChars / 2];
  for (int i = 0; i < NumberChars; i += 2)
    bytes[i / 2] = Convert.ToByte(hex.Substring(i, 2), 16);
  return bytes;
}

Использование Substring - лучший вариант в сочетании с Convert.ToByte. См. Этот ответ для получения дополнительной информации. Если вам нужна более высокая производительность, вы должны избегать Convert.ToByte прежде чем вы сможете отбросить SubString.

Tomalak 22 нояб. 2008, в 12:14

0

отсутствует точка с запятой в шестнадцатеричной строке.AppendFormat (строка "{0: x2}", b)
el2iot2 23 дек. 2008, в 00:37
17

Вы используете SubString. Разве этот цикл не выделяет ужасное количество строковых объектов?
Wim Coenen 06 март 2009, в 16:36
26

Честно говоря, до тех пор, пока производительность не резко упадет, я бы проигнорировал это и доверился бы Runtime и GC позаботиться об этом.
Tomalak 06 март 2009, в 17:11
1

Я мог получить 4-кратное ускорение на моей машине, исключив подстроку. Не могу опубликовать код, потому что я написал это для своего работодателя.
Wim Coenen 08 март 2009, в 18:26
1

Ваш StringToByteArray () завершается ошибкой, если у вас нечетное количество шестнадцатеричных символов. Это легко исправить, добавив нечетные строки с "0" на передней панели.
Carlos Rendon 23 нояб. 2009, в 17:21
83

Поскольку байт - это два куска, любая шестнадцатеричная строка, которая корректно представляет массив байтов, должна иметь четное количество символов. 0 нигде не должен быть добавлен - для добавления было бы сделано предположение о недопустимых данных, которые потенциально опасны. Во всяком случае, метод StringToByteArray должен генерировать исключение FormatException, если шестнадцатеричная строка содержит нечетное количество символов.
David Boike 09 март 2010, в 19:01
0

Первый пример возвращает другое значение, чем второй. Кто-нибудь может объяснить почему?
iJK 20 апр. 2010, в 14:39
0

@DavidBoike Хотя я согласен, если вас интересует только математическое представление, то можно добавить всю строку с нулями, но вы правы, это почти наверняка плохие данные, потому что вы запрашиваете байты взамен, и байты всегда будут соответственно дополнены.
McKay 22 июнь 2012, в 19:22
2

См. Stackoverflow.com/a/14332574/22656 для версии, которая не использует подстроку.
Jon Skeet 15 янв. 2013, в 07:09
0

@DavidBoike - это "F" неверная шестнадцатеричная строка? Разве это не то же самое, что "0F"? Таким образом, у вас может быть шестнадцатеричная строка с количеством нечетных символов.
00jt 28 янв. 2013, в 15:15
6

@ 00jt Вы должны сделать предположение, что F == 0F. Либо это то же самое, что и 0F, либо вход был обрезан, и F фактически является началом чего-то, что вы не получили. Это зависит от вашего контекста, чтобы сделать эти предположения, но я считаю, что функция общего назначения должна отклонять нечетные символы как недействительные, вместо того, чтобы делать это предположение для вызывающего кода.
David Boike 28 янв. 2013, в 15:35
9

@DavidBoike Вопрос не имел ничего общего с тем, «как обрабатывать возможные отсеченные значения потока». Это говорит о String. String myValue = 10.ToString ("X"); myValue это "A", а не "0A". Теперь прочитайте эту строку обратно в байты, ой, вы сломали ее.
00jt 30 янв. 2013, в 19:25
1

Это прямо указано в вопросе, что они хотели бы, чтобы он действительно преобразовал обратно. F! = 0F, так что вы получите другой результат. Кроме того, это просто плохая практика делать ненужные предположения. Ваш пример глуп, вы бы использовали ToString ("X2"). Ваш пример идентичен, говоря, что если вы используете ToString ("X3"), он не проходит через функции шестнадцатеричного разбора. Конечно, не потому, что вы кодировали его нестандартным способом.
Rushyo 24 окт. 2013, в 10:18
0

В .Net Micro Framework нет ни Convert.ToByte принимающего два аргумента, ни StringReader , было бы замечательно увидеть StringToByteArray в ответе без используемых.
dumbledad 19 июль 2014, в 20:43
0

Найден один: stackoverflow.com/a/14332574/575530
dumbledad 19 июль 2014, в 21:20
0

var str = System.Text.Encoding.Default.GetString (result);
Hamed Zakery Miab 14 янв. 2015, в 06:12
0

@Link указывает на спам. thinksharp.org/hex-string-to-byte-array-converter/
kanchirk 18 март 2015, в 17:09
0

@DavidBoike Я никогда не знал, что такое клев. Ваш комментарий заставил меня осознать. Благодарю.
RBT 21 нояб. 2016, в 07:18
1

StringToByteArray - ужасное имя для этой функции. Назовите его EncodeHex или DecodeHex или создайте класс Hex и поместите в методы Encode или Decode . Вы также можете декодировать base64, кодировать как UTF-8 или UTF-16 и называть его StringToByteArray . Куда-то нужно вставить Hex часть имени.
Maarten Bodewes 11 июнь 2018, в 00:40

Показать ещё 17 комментариев