Почему 24,0000 не равно 24,0000 в MATLAB?

Question

Почему 24,0000 не равно 24,0000 в MATLAB?

56

Я пишу программу, где мне нужно удалить повторяющиеся точки, хранящиеся в матрице. Проблема в том, что, когда дело доходит до проверки того, находятся ли эти точки в матрице, MATLAB не может распознать их в матрице, хотя они существуют.

В следующем коде функция intersections получает точки пересечения:

[points(:,1), points(:,2)] = intersections(...
    obj.modifiedVGVertices(1,:), obj.modifiedVGVertices(2,:), ...
    [vertex1(1) vertex2(1)], [vertex1(2) vertex2(2)]);

Результат:

>> points
points =
   12.0000   15.0000
   33.0000   24.0000
   33.0000   24.0000

>> vertex1
vertex1 =
    12
    15

>> vertex2    
vertex2 =
    33
    24

Две точки (vertex1 и vertex2) должны быть исключены из результата. Это должно быть сделано с помощью следующих команд:

points = points((points(:,1) ~= vertex1(1)) | (points(:,2) ~= vertex1(2)), :);
points = points((points(:,1) ~= vertex2(1)) | (points(:,2) ~= vertex2(2)), :);

После этого мы получаем этот неожиданный результат:

>> points
points =
   33.0000   24.0000

Результат должен быть пустой матрицей. Как вы можете видеть, первая (или вторая?) Пара [33.0000 24.0000] была устранена, но не вторая.

Затем я проверил эти два выражения:

>> points(1) ~= vertex2(1)
ans =
     0
>> points(2) ~= vertex2(2)
ans =
     1   % <-- It means 24.0000 is not equal to 24.0000?

В чем проблема?

Более удивительно, что я создал новый script, который имеет только следующие команды:

points = [12.0000   15.0000
          33.0000   24.0000
          33.0000   24.0000];

vertex1 = [12 ;  15];
vertex2 = [33 ;  24];

points = points((points(:,1) ~= vertex1(1)) | (points(:,2) ~= vertex1(2)), :);
points = points((points(:,1) ~= vertex2(1)) | (points(:,2) ~= vertex2(2)), :);

Результат, как ожидалось:

>> points
points =  
   Empty matrix: 0-by-2

Kamran Bigdely 26 март 2009, в 16:58

Источник

1

Это также было решено здесь
ChrisF♦ 26 март 2009, в 16:28
2

@Kamran: Извините, я не указал на опасности сравнения с плавающей запятой, когда вы спросили о сравнении значений в другом вопросе. Мне не сразу пришло в голову, что вы можете столкнуться с этой проблемой.
gnovice 26 март 2009, в 16:43
2

Как примечание стороны, сравните 1.2 - 0.2 - 1 == 0 и 1.2 - 1 - 0.2 == 0 . Удивительно, не правда ли? Когда вы имеете дело с числами с плавающей точкой, порядок операций имеет значение.
jubobs 12 окт. 2014, в 12:51
0

@TickTock - Ваш новый заголовок не помог. Я извиняюсь, но я откатил ваши правки ... не говоря уже о том, что грамматика была немного плохой ... без обид.
rayryeng 18 авг. 2016, в 07:22
0

@rayryeneng относительно вашей точки зрения, мы должны выглядеть как глаз Гуглера, который что-то ищет. Он может использовать некоторые ключевые слова, такие как математические или плавающие числа, но он практически никогда не использует 24,0000! Это был мой подход к изданию, которое я сделал, и я думаю, что это правда (не говоря о грамматических ошибках, которые я мог сделать). Я хочу, чтобы вы сделали какое-то издание, которое лучше всего звучит и лучше всего доступно для поиска через поисковые системы (как люди записывают свои вопросы и гуглит). Также я благодарю вас за упоминание. Bests
Behzad Seyfi 18 авг. 2016, в 22:26
1

@ Тик Ток: Как автор вопроса, я даже не мог понять название, которое вы выбрали для моего вопроса. Также это не отражало тот факт, что MATLAB не отображает всю часть числа с плавающей запятой при выводе переменной.
Kamran Bigdely 18 авг. 2016, в 22:34
0

@kami, предположим, что кто-то сталкивается с подобной проблемой, спросите себя, How he/she could direct to your question? . в вашем вопросе есть ключевые слова: 24.0000 (он никогда не использует, практически) и "не равно" и "Matlab". Я просто изменяю ваше название: 24.0000 и 24.0000 математически равны. Если вы скажете кому-нибудь, они скажут, что эти два числа равны в математике, НО в компьютерном мире они обычно не равны (в компьютерных науках каждое число, которое имеет точку, например, 1.2 3,65 и 24,0000 упоминаются как числа с floating point number ), поэтому я объединил эти термины и включил ваше упоминание "24,0000".
Behzad Seyfi 19 авг. 2016, в 11:27
0

@ Tick Tock: вы правы в том, что заголовок не подходит для Google. Может быть, мы должны изменить это на что-то вроде «почему число не равно самому себе в matlab» или что-то в этом роде.
Kamran Bigdely 19 авг. 2016, в 14:54
0

@kami, почему число FLOATING POINT не равно .... Как вы знаете, целые числа равны.
Behzad Seyfi 19 авг. 2016, в 15:42
0

Пожалуйста, оставьте заголовок без изменений. Все из нас, кто регулярно отвечает на вопросы в MATLAB, используют текущее название как средство поиска этого вопроса. Никаких изменений не требуется. Спасибо, что рассмотрели это, хотя Ками.
rayryeng 19 авг. 2016, в 22:58
0

Возможный дубликат лучшей практики для сравнения поплавков в Matlab
m7913d 04 май 2017, в 15:20
0

@ m7913d: Этот вопрос был задан более 8 лет назад, но этот вопрос был задан два года назад. Таким образом, вы должны поставить дубликат записку по этому вопросу, а не этот!
Kamran Bigdely 04 май 2017, в 16:06
0

@kami Я знаю, но я думаю, что людям с одинаковой проблемой было бы полезно показать, что оба вопроса связаны между собой. Флаг был не виноват вас, но чтобы помочь другим людям.
m7913d 04 май 2017, в 16:16
1

@ m7913d, понятно. но обычно они ставят ярлык «дубликат» на новый вопрос. Пожалуйста, ознакомьтесь с правилами для дубликата этикетки: meta.stackexchange.com/questions/10841/…
Kamran Bigdely 04 май 2017, в 17:28
1

@ m7913d: из объяснения повторяющегося правила: «Обычно недавний вопрос будет закрыт как дубликат старого вопроса».
Kamran Bigdely 04 май 2017, в 17:31

Показать ещё 13 комментариев

Теги:

floating-point

matlab

precision

6 ответов

19

Посмотрите на эту статью: Опасности плавающей точки. Хотя его примеры в FORTRAN имеют смысл практически для любого современного языка программирования, включая MATLAB. Ваша проблема (и решение для нее) описана в разделе "Безопасные сравнения".

Rorick 26 март 2009, в 16:59

1

Я обнаружил это некоторое время назад и был очень впечатлен этим =) Теперь я всегда рекомендую это в подобных ситуациях.
Rorick 27 март 2009, в 08:26
0

Архивная версия этого отличного ресурса!
wizclown 12 июль 2018, в 12:37

12

тип

format long g

Эта команда покажет ПОЛНОЕ значение числа. Вероятно, это будет что-то вроде 24.00000021321!= 24.00000123124

KitsuneYMG 26 март 2009, в 22:57

7

Попробуйте написать

0,1 + 0,1 + 0,1 == 0,3.

Предупреждение: вы можете быть удивлены результатом!

Andrey Rubshtein 14 дек. 2011, в 20:38

0

Я попробовал, и он возвращает 0. Но я не вижу, что он должен делать, с проблемой выше. Можете ли вы объяснить это мне?
Max 16 сен. 2015, в 08:46
6

Это происходит потому, что 0.1 имеет некоторую ошибку с плавающей запятой, и когда вы добавляете три таких термина вместе, ошибки не обязательно добавляют до 0. Та же проблема приводит к тому, что (плавающее) 24 не совсем точно равно (другое плавающее) 24 ,
Derek 04 март 2016, в 11:14

1

Просмотрите функцию EPS Matlab.

Matlab использует математику с плавающей запятой до 16 цифр точности (отображается только 5).

jle 26 март 2009, в 16:47

1

Возможно, эти два номера действительно 24.0 и 24.000000001, но вы не видите все десятичные знаки.

Jimmy J 26 март 2009, в 16:40

Ещё вопросы

@Kamran: Извините, я не указал на опасности сравнения с плавающей запятой, когда вы спросили о сравнении значений в другом вопросе. Мне не сразу пришло в голову, что вы можете столкнуться с этой проблемой.
Как примечание стороны, сравните 1.2 - 0.2 - 1 == 0 и 1.2 - 1 - 0.2 == 0 . Удивительно, не правда ли? Когда вы имеете дело с числами с плавающей точкой, порядок операций имеет значение.
@TickTock - Ваш новый заголовок не помог. Я извиняюсь, но я откатил ваши правки ... не говоря уже о том, что грамматика была немного плохой ... без обид.
@rayryeneng относительно вашей точки зрения, мы должны выглядеть как глаз Гуглера, который что-то ищет. Он может использовать некоторые ключевые слова, такие как математические или плавающие числа, но он практически никогда не использует 24,0000! Это был мой подход к изданию, которое я сделал, и я думаю, что это правда (не говоря о грамматических ошибках, которые я мог сделать). Я хочу, чтобы вы сделали какое-то издание, которое лучше всего звучит и лучше всего доступно для поиска через поисковые системы (как люди записывают свои вопросы и гуглит). Также я благодарю вас за упоминание. Bests
@ Тик Ток: Как автор вопроса, я даже не мог понять название, которое вы выбрали для моего вопроса. Также это не отражало тот факт, что MATLAB не отображает всю часть числа с плавающей запятой при выводе переменной.
@kami, предположим, что кто-то сталкивается с подобной проблемой, спросите себя, How he/she could direct to your question? . в вашем вопросе есть ключевые слова: 24.0000 (он никогда не использует, практически) и "не равно" и "Matlab". Я просто изменяю ваше название: 24.0000 и 24.0000 математически равны. Если вы скажете кому-нибудь, они скажут, что эти два числа равны в математике, НО в компьютерном мире они обычно не равны (в компьютерных науках каждое число, которое имеет точку, например, 1.2 3,65 и 24,0000 упоминаются как числа с floating point number ), поэтому я объединил эти термины и включил ваше упоминание "24,0000".
@ Tick Tock: вы правы в том, что заголовок не подходит для Google. Может быть, мы должны изменить это на что-то вроде «почему число не равно самому себе в matlab» или что-то в этом роде.
@kami, почему число FLOATING POINT не равно .... Как вы знаете, целые числа равны.
Пожалуйста, оставьте заголовок без изменений. Все из нас, кто регулярно отвечает на вопросы в MATLAB, используют текущее название как средство поиска этого вопроса. Никаких изменений не требуется. Спасибо, что рассмотрели это, хотя Ками.
Возможный дубликат лучшей практики для сравнения поплавков в Matlab
@ m7913d: Этот вопрос был задан более 8 лет назад, но этот вопрос был задан два года назад. Таким образом, вы должны поставить дубликат записку по этому вопросу, а не этот!
@kami Я знаю, но я думаю, что людям с одинаковой проблемой было бы полезно показать, что оба вопроса связаны между собой. Флаг был не виноват вас, но чтобы помочь другим людям.
@ m7913d, понятно. но обычно они ставят ярлык «дубликат» на новый вопрос. Пожалуйста, ознакомьтесь с правилами для дубликата этикетки: meta.stackexchange.com/questions/10841/…
@ m7913d: из объяснения повторяющегося правила: «Обычно недавний вопрос будет закрыт как дубликат старого вопроса».
Я обнаружил это некоторое время назад и был очень впечатлен этим =) Теперь я всегда рекомендую это в подобных ситуациях.
Архивная версия этого отличного ресурса!
Я попробовал, и он возвращает 0. Но я не вижу, что он должен делать, с проблемой выше. Можете ли вы объяснить это мне?
Это происходит потому, что 0.1 имеет некоторую ошибку с плавающей запятой, и когда вы добавляете три таких термина вместе, ошибки не обязательно добавляют до 0. Та же проблема приводит к тому, что (плавающее) 24 не совсем точно равно (другое плавающее) 24 ,

gnovice · Accepted Answer · 2009-03-26T16-34-00.000Z

Проблема, с которой вы связаны, связана с тем, как числа с плавающей запятой представлены на компьютере. Более подробное обсуждение представлений с плавающей запятой появляется к концу моего ответа (раздел "Плавающее представление" ). Версия TL; DR: поскольку компьютеры имеют ограниченное количество памяти, цифры могут быть представлены только с конечной точностью. Таким образом, точность чисел с плавающей запятой ограничена определенным количеством десятичных знаков (около 16 значащих цифр для значений двойной точности, значение по умолчанию используется в MATLAB).

Фактическая и отображаемая точность

Теперь, чтобы обратиться к конкретному примеру в вопросе... пока 24.0000 и 24.0000 отображаются таким же образом, оказывается, что в этом случае они фактически отличаются очень маленькими десятичными суммами. Вы не видите этого, потому что MATLAB отображает только 4 значащих цифры по умолчанию, сохраняя общий дисплей опрятным и аккуратным. Если вы хотите чтобы увидеть полную точность, вы должны либо выдать команду format long, либо просмотреть шестнадцатеричное представление номера:

>> pi
ans =
    3.1416
>> format long
>> pi
ans =
   3.141592653589793
>> num2hex(pi)
ans =
400921fb54442d18

Инициализированные значения против вычисленных значений

Поскольку существует только конечное число значений, которые могут быть представлены для числа с плавающей запятой, возможно, что вычисление приведет к значению, которое находится между двумя из этих представлений. В таком случае результат должен быть округлен до одного из них. Это приводит к небольшой ошибке машинной точности. Это также означает, что инициализация значения напрямую или некоторым вычислением может дать несколько иные результаты. Например, значение 0.1 не имеет точного представления с плавающей запятой (т.е. Оно слегка округляется), и поэтому вы получаете контр-интуитивные результаты, подобные этому из-за скопления ошибок округления:/p >

>> a=sum([0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1]);  % Sum 10 0.1s
>> b=1;                                               % Initialize to 1
>> a == b
ans =
  logical
   0                % They are unequal!
>> num2hex(a)       % Let check their hex representation to confirm
ans =
3fefffffffffffff
>> num2hex(b)
ans =
3ff0000000000000

Как правильно обрабатывать сравнения с плавающей запятой

Поскольку значения с плавающей запятой могут отличаться очень небольшими суммами, любые сравнения должны быть выполнены путем проверки того, что значения находятся в пределах некоторого диапазона (то есть, допуска) друг от друга, а не в точности равны друг другу. Например:

a = 24;
b = 24.000001;
tolerance = 0.001;
if abs(a-b) < tolerance, disp('Equal!'); end

отобразит "Равно!".

Затем вы можете изменить свой код на что-то вроде:

points = points((abs(points(:,1)-vertex1(1)) > tolerance) | ...
                (abs(points(:,2)-vertex1(2)) > tolerance),:)

Представление с плавающей запятой

Хороший обзор чисел с плавающей запятой (и, в частности, стандарт IEEE 754 для арифметики с плавающей запятой) Что каждый компьютерный ученый должен знать о арифметике с плавающей точкой Дэвида Голдберга.

Двоичное число с плавающей запятой фактически представлено тремя целыми числами: знаковый бит s, значение (или коэффициент/доля) b и показатель e. Для формата с плавающей запятой с двойной точностью каждый номер представлен 64 битами, выложенными в памяти следующим образом:

Реальное значение можно найти по следующей формуле:

Этот формат допускает числовые представления в диапазоне от 10 ^ -308 до 10 ^ 308. Для MATLAB вы можете получить эти ограничения из realmin и realmax:

>> realmin
ans =
    2.225073858507201e-308
>> realmax
ans =
    1.797693134862316e+308

Так как существует конечное число бит, используемых для представления числа с плавающей запятой, то в указанном выше диапазоне имеется только очень много конечных чисел. Вычисления часто приводят к значению, которое точно не соответствует одному из этих конечных представлений, поэтому значения должны округляться. Эти машинные ошибки точности проявляются по-разному, как описано в приведенных выше примерах.

Чтобы лучше понять эти ошибки округления, полезно взглянуть на относительную точность с плавающей запятой, предоставляемую функцией eps, который количественно определяет расстояние от заданного числа до следующего по величине представления с плавающей запятой:

>> eps(1)
ans =
     2.220446049250313e-16
>> eps(1000)
ans =
     1.136868377216160e-13

Обратите внимание, что точность соответствует размеру представленного числа; большие числа будут иметь большие расстояния между представлениями с плавающей запятой и, следовательно, будут иметь меньше цифр точности после десятичной точки. Это может быть важным соображением при некоторых расчетах. Рассмотрим следующий пример:

>> format long              % Display full precision
>> x = rand(1, 10);         % Get 10 random values between 0 and 1
>> a = mean(x)              % Take the mean
a =
   0.587307428244141
>> b = mean(x+10000)-10000  % Take the mean at a different scale, then shift back
b =
   0.587307428244458

Обратите внимание, что когда мы смещаем значения x из диапазона [0 1] в диапазон [10000 10001], вычисляем среднее значение, а затем вычитаем среднее смещение для сравнения, получаем значение, которое отличается для последних 3 существенных цифры. Это иллюстрирует, как смещение или масштабирование данных может изменить точность выполненных на нем вычислений, что должно быть связано с определенными проблемами.

почему я не вижу эту маленькую десятичную сумму?
Вы можете увидеть это, если посмотрите на переменную в матричном представлении. Щелкните правой кнопкой мыши по переменной -> «Просмотреть выделение» или что-то? У меня нет MATLAB здесь, поэтому я не могу проверить.
Вы также можете увидеть небольшие различия, набрав «format long» в командной строке.
Matlab имеет около 16 цифр точности ... отображает только 5, если вы не делаете выше
Вы правы: формат длинных точек = 12,000000000000000 15,000000000000000 33,000000000000000 23,999999999999996 33,000000000000000 24,000000000000000
«Формат шестнадцатеричный» может иногда помочь даже больше, чем форматировать долго здесь.
Может быть полезно предоставить ссылку на Best Practice for Float Comparison в Matlab .