Java Byte [] to int (Big Endian) с использованием << Weirdness

Question

Java Byte [] to int (Big Endian) с использованием << Weirdness

1

Предположим, что у нас есть следующий байт [4]:

44 a4 8a c6

Итак, что случилось со следующим кодом:

public static int asIntBigEndian(byte[] raw, int offset){
int result = 0;
for(int i=offset; i<offset+4; ++i){
    result = (result << 4) | raw[i]; 
}
return result;
}

Результатом вызова asIntBigEndian (raw, 0) является:

ff ff ff e6

Я заметил, что если бы я прочитал первый байт и распечатал его, я получу:

44

Я бы получил тот же результат, если бы я это сделал:

System.out.println(Integer.toHexString(raw[0] << 24));

0x44000000

Итак, если бы я продолжал логику...

System.out.println(Integer.toHexString( (raw[0] << 24)|(raw[1] << 16) );

0xffa40000

В основном первый байт превратился в 0xff, а второй байт 0xa4 был "xor" в правильное положение. Почему это происходит?

ChaoSXDemon 06 июнь 2014, в 07:38

Источник

0

Разве числа не подписаны на Java?
Anubian Noob 06 июнь 2014, в 04:44
0

Это недопустимые значения байтов. Пожалуйста, дайте нам минимальный рабочий пример.
Sotirios Delimanolis 06 июнь 2014, в 04:46
0

@AnubianNoob Да, Java подписана ... но это не должно иметь значения, если бы я должен был распечатать его в Hex, верно?
ChaoSXDemon 06 июнь 2014, в 04:47
0

@SotiriosDelimanolis Что вы имеете в виду, что они не являются действительными значениями байтов? 0x44a48ac6 = 1151634118.
ChaoSXDemon 06 июнь 2014, в 04:48
0

Это не 0xA4, это -0x5C. Что такое -0x5C << 16? Это -0x5C0000. Что такое 0x44000000 | -0x5C0000?
immibis 06 июнь 2014, в 04:49
0

Какие значения содержит ваш аргумент byte[] ?
Sotirios Delimanolis 06 июнь 2014, в 04:49
0

Предположим, у нас есть следующий байт [4]: 44 a4 8a c6. Таким образом, сдвиг 2-го индекса на 16 бит вверх должен привести к получению значения 00a40000 и, если ранее был 1-й индекс на 24 бита, переход к 44000000 | 00a40000 = 44a40000
ChaoSXDemon 06 июнь 2014, в 04:51
2

@ChaosXDemon 0xA4 не является допустимым значением byte . byte в Java имеют диапазон от -128 до 127 (от -0x80 до 0x7F)
immibis 06 июнь 2014, в 04:52
0

@immibis действительно! Я забыл об этом! Таким образом, я должен преобразовать байт в короткий, а затем преобразовать в int?
ChaoSXDemon 06 июнь 2014, в 04:55
0

Однако ... если бы я должен был распечатать String.format ("% 02x", raw [0]) для каждого байта, я получил бы 44 a4 8a c6. Означает ли это, что это действительно?
ChaoSXDemon 06 июнь 2014, в 04:58
0

Сделай Arrays.toString(raw) и покажи нам это.
Sotirios Delimanolis 06 июнь 2014, в 05:01
0

Шестнадцатеричная печать не учитывает признаки. Было бы одинаково правильно думать, что 0xA4 является байтом, за исключением того, что он не работает таким образом в математических операциях (он работает как -0x5C).
immibis 06 июнь 2014, в 05:02
0

Я получаю [68, -92, -118, -58], который указывает, что 2-й байт недействителен
ChaoSXDemon 06 июнь 2014, в 05:04

Показать ещё 11 комментариев

Теги:

java

int

endianness

byte

2 ответа

0

На практике

public static int asIntBigEndian(byte[] raw, int offset){
    ByteBuffer buffer = ByteBuffer.wrap(raw, offset, 4);
    buffer.order(ByteOrder.BIG_ENDIAN);
    return buffer.getInt();
}

Там наверху, но это так просто.

В этом случае в вашем кодовом коде вам может быть лучше подан ByteBuffer.

David Ehrmann 06 июнь 2014, в 04:32

Ещё вопросы

Это недопустимые значения байтов. Пожалуйста, дайте нам минимальный рабочий пример.
@AnubianNoob Да, Java подписана ... но это не должно иметь значения, если бы я должен был распечатать его в Hex, верно?
@SotiriosDelimanolis Что вы имеете в виду, что они не являются действительными значениями байтов? 0x44a48ac6 = 1151634118.
Это не 0xA4, это -0x5C. Что такое -0x5C << 16? Это -0x5C0000. Что такое 0x44000000 | -0x5C0000?
Какие значения содержит ваш аргумент byte[] ?
Предположим, у нас есть следующий байт [4]: 44 a4 8a c6. Таким образом, сдвиг 2-го индекса на 16 бит вверх должен привести к получению значения 00a40000 и, если ранее был 1-й индекс на 24 бита, переход к 44000000 | 00a40000 = 44a40000
@ChaosXDemon 0xA4 не является допустимым значением byte . byte в Java имеют диапазон от -128 до 127 (от -0x80 до 0x7F)
@immibis действительно! Я забыл об этом! Таким образом, я должен преобразовать байт в короткий, а затем преобразовать в int?
Однако ... если бы я должен был распечатать String.format ("% 02x", raw [0]) для каждого байта, я получил бы 44 a4 8a c6. Означает ли это, что это действительно?
Сделай Arrays.toString(raw) и покажи нам это.
Шестнадцатеричная печать не учитывает признаки. Было бы одинаково правильно думать, что 0xA4 является байтом, за исключением того, что он не работает таким образом в математических операциях (он работает как -0x5C).
Я получаю [68, -92, -118, -58], который указывает, что 2-й байт недействителен

immibis · Accepted Answer · 2014-06-06T02-38-00.000Z

byte в Java имеет диапазон от -128 (-0x80) до 127 (0x7F). 164 (0xA4) не является допустимым значением, но "A4" - это то, что вы получили, напечатав -92 (-0x5C), как если бы он был без знака.

Преобразование -0x5C в int также дает -0x0000005C. -0x0000005C, напечатанный как unsigned, равен 0xFFFFFFA4.

Другой, возможно, более простой способ думать об этом - думать обо всех значениях как unsigned, но рассматривать преобразование как расширение знака - где верхний бит копируется во все новые биты. Если вы так думаете, 0xA4 является допустимым байтом и (int) 0xA4 равен 0xFFFFFFA4. Тот же результат, более простой мыслительный процесс, но это менее правильный способ думать о числах в Java (не в том, что это имеет значение).

0xFFFFFFA4 << 16 дает 0xFFA40000 и 0x44000000 | 0xFFA40000 0x44000000 | 0xFFA40000 дает 0xFFA40000 - вот как вы получили этот результат.

Исправление прост - вместо raw[i], используйте ((int)raw[i] & 0xFF) или просто (raw[i] & 0xFF) поскольку преобразование в int неявно.

Кроме того, не связанная с этой проблемой (result << 4) должен быть (result << 8). В противном случае вы вычисляете 0x44000 | 0xA400 | 0x8A0 | 0xC6 0x44000 | 0xA400 | 0x8A0 | 0xC6 0x44000 | 0xA400 | 0x8A0 | 0xC6 вместо 0x44000000 | 0xA40000 | 0x8A00 | 0xC6 0x44000000 | 0xA40000 | 0x8A00 | 0xC6 0x44000000 | 0xA40000 | 0x8A00 | 0xC6.

Спасибо за подробное объяснение. Это имеет смысл сейчас!