Конвертировать char в int в C и C ++

Question

Конвертировать char в int в C и C ++

232

Как преобразовать char в int в C и С++?

mainajaved 17 фев. 2011, в 13:37

Источник

1

@Matt: было бы неплохо быть более конкретным. вопрос об обобщении просто предлагает обобщенные ответы, которые не применимы или даже не подходят для вашей задачи. имейте в виду, что когда вам приходится спрашивать, вы, вероятно, не знаете достаточно, чтобы правильно обобщать.
Cheers and hth. - Alf 17 фев. 2011, в 14:18
0

@Alf P. Steinbach: Первоначальный вопрос был неопределенным в отношении того, на каком языке. С ключевыми словами c и c++ , я думаю, ответы на оба языка являются разумными.
Matt Joiner 17 фев. 2011, в 14:25
8

Исходя из моего большого опыта работы на других технических форумах, моя интуиция заключается в том, что ОП на самом деле означает «как взять текстовое представление числа (в базе 10) и преобразовать его в соответствующее число?» Вообще говоря, неофиты C и C ++ обычно имеют невероятно смутные представления о том, как работает текст на этих языках и что на самом деле означает char .
Karl Knechtel 17 фев. 2011, в 15:56
3

@KarlKnechtel: Если это правда (я даю примерно 50/50, так как многие ранние руководства также поощряют получение значений ASCII из символов, даже если ASCII не охватывает весь диапазон), ОП требует ясности - но это обман of stackoverflow.com/questions/439573/… .
Fred Nurk 17 фев. 2011, в 16:51
3

У ОП было три часа, чтобы уточнить этот вопрос, и он не смог этого сделать. Как это, нет никакого способа узнать, что на самом деле спрашивают. Проголосовал за закрытие.
sbi 17 фев. 2011, в 17:27
0

Вообще-то, возможно, это что-то вроде дурака ...
T.E.D. 17 фев. 2011, в 17:52
0

возможный дубликат символа в целое число в C
Helen 17 фев. 2011, в 19:59
0

Обратите внимание, что даже если вы можете выполнять неявное приведение назад и вперед, когда дело доходит до int и char, есть некоторые действительно важные вещи, которые необходимо знать: 1) в зависимости от ситуации вы можете потерять знак минус вашего числа (хранится как char) если ты не осторожен Вот почему есть знак со знаком и без знака; 2) sizeof (char) = 1Byte (всегда; здесь я исключаю символ WIDE, который может быть больше 8 бит), но sizeof (int) = не менее 4Bytes! Char - это целочисленный тип с некоторыми ограничениями. Я советую вам избегать использования char для математических вычислений, если только вам это не нужно.
rbaleksandar 17 июль 2013, в 03:21

Показать ещё 6 комментариев

Теги:

c++

c

gcc

11 ответов

Ещё вопросы

@Matt: было бы неплохо быть более конкретным. вопрос об обобщении просто предлагает обобщенные ответы, которые не применимы или даже не подходят для вашей задачи. имейте в виду, что когда вам приходится спрашивать, вы, вероятно, не знаете достаточно, чтобы правильно обобщать.
@Alf P. Steinbach: Первоначальный вопрос был неопределенным в отношении того, на каком языке. С ключевыми словами c и c++ , я думаю, ответы на оба языка являются разумными.
Исходя из моего большого опыта работы на других технических форумах, моя интуиция заключается в том, что ОП на самом деле означает «как взять текстовое представление числа (в базе 10) и преобразовать его в соответствующее число?» Вообще говоря, неофиты C и C ++ обычно имеют невероятно смутные представления о том, как работает текст на этих языках и что на самом деле означает char .
@KarlKnechtel: Если это правда (я даю примерно 50/50, так как многие ранние руководства также поощряют получение значений ASCII из символов, даже если ASCII не охватывает весь диапазон), ОП требует ясности - но это обман of stackoverflow.com/questions/439573/… .
У ОП было три часа, чтобы уточнить этот вопрос, и он не смог этого сделать. Как это, нет никакого способа узнать, что на самом деле спрашивают. Проголосовал за закрытие.
Вообще-то, возможно, это что-то вроде дурака ...
возможный дубликат символа в целое число в C
Обратите внимание, что даже если вы можете выполнять неявное приведение назад и вперед, когда дело доходит до int и char, есть некоторые действительно важные вещи, которые необходимо знать: 1) в зависимости от ситуации вы можете потерять знак минус вашего числа (хранится как char) если ты не осторожен Вот почему есть знак со знаком и без знака; 2) sizeof (char) = 1Byte (всегда; здесь я исключаю символ WIDE, который может быть больше 8 бит), но sizeof (int) = не менее 4Bytes! Char - это целочисленный тип с некоторыми ограничениями. Я советую вам избегать использования char для математических вычислений, если только вам это не нужно.

Foo Bah · Answer 1 · 2011-02-17T15-49-00.000Z

Зависит от того, что вы хотите сделать:

чтобы прочитать значение как код ascii, вы можете написать

char a = 'a';
int ia = (int)a; 
/* note that the int cast is not necessary -- int ia = a would suffice */

чтобы преобразовать символ '0' -> 0, '1' -> 1 и т.д., вы можете написать

char a = '4';
int ia = a - '0';
/* check here if ia is bounded by 0 and 9 */

@KshitijBanerjee Это не очень хорошая идея по двум причинам: он дает вам отрицательное число для символов ascii перед '0' (например, & -> -10), и это дает вам числа больше 10 (например, x -> 26)
@ kevin001 Если вы хотите преобразовать char в int, а символ '1' предоставляет число ascii, отличное от 1 , вам нужно удалить смещение '0' чтобы выровнять его, чтобы считать от 0 до 9. Последовательные числа 1-9 соседствуют в целом числе ascii.
этот трюк «0» удивителен. очень помог мне
Можете ли вы описать принцип этой магии?

Matt Joiner · Answer 2 · 2011-02-17T14-15-00.000Z

53

C и С++ всегда поддерживают типы по меньшей мере int. Кроме того, символьные литералы имеют тип int в C и char в С++.

Вы можете преобразовать тип char, просто назначив int.

char c = 'a'; // narrowing on C
int a = c;

Matt Joiner 17 фев. 2011, в 14:15

3

Вы также можете использовать крайне недооцененный унарный operator+() для этой цели.
Cubbi 17 фев. 2011, в 14:14
23

-1 Ответ неверен только для осмысленного толкования вопроса. Это (code int a = c; ) сохранит любые отрицательные значения, с которыми стандартные функции библиотеки C не могут иметь дело. Стандартные библиотечные функции C устанавливают стандарт того, что значит обрабатывать значения char как int .
Cheers and hth. - Alf 17 фев. 2011, в 14:14
0

@ Наваз - ... при условии, что он хочет простой тип, а не фактическое преобразование.
T.E.D. 17 фев. 2011, в 14:21
0

@ Альф П. Штайнбах: Я не согласен, это выходит за рамки вопроса и предполагает слишком много. Также обратите внимание, что добавление символьных буквальных интерпретаций направлено на ответ @Sayam Ahmed. Этот ответ сводится к int a = c; как достаточно.
Matt Joiner 17 фев. 2011, в 14:26
0

@TED ... хм .. может быть .. этот вопрос сейчас кажется недостаточно ясным ..
Nawaz 17 фев. 2011, в 14:27
4

@Matt: я держу вниз голосов. Я бы усилил это, если это возможно! Интерпретация вопроса, которую вы и другие предположили, не имеет смысла, потому что она слишком тривиальна, и потому что для конкретной комбинации типов OP есть не очень тривиальная очень важная практическая проблема. Совет, который вы даете, непосредственно опасен для новичка. Скорее всего, это приведет к неопределенному поведению для их программ, которые используют функции классификации символов стандартной библиотеки C. Реф. на ответ @ Sayam, он удалил этот ответ.
Cheers and hth. - Alf 17 фев. 2011, в 15:22
3

-1 за неправильность: isupper () будет иметь неопределенные результаты, если передан 1252 старшего символа.
Chris Becke 17 фев. 2011, в 15:34
1

Что вы подразумеваете под «всегда продвигать»? Значения повышаются во время неявных преобразований, передачи определенных типов параметров (например, в функцию varargs) и когда оператор должен сделать свои операнды совместимыми типами. Но, безусловно, бывают случаи, когда значение не продвигается (например, если я передаю символ функции, ожидающей символ), иначе у нас не было бы типов, меньших, чем int.
Adrian McCarthy 18 май 2013, в 19:44
0

Не работал для меня. Я должен был сделать: например, «5» - «0» = 5
Koray Tugay 24 нояб. 2013, в 07:47
0

Мы должны сделать num-'0 ', чтобы это работало.
Shivendra 30 май 2017, в 19:50

Показать ещё 8 комментариев

Vlad Isoc · Answer 3 · 2015-06-09T09-55-00.000Z

40

Ну, в ascii коды начинаются от 48. Все, что вам нужно сделать, это:

int x = (int)character - 48;

Vlad Isoc 09 июнь 2015, в 09:55

42

Или более читабельно: ' int x = character - '0'
chad 27 июль 2016, в 22:37
13

@chad: не только более читабельный, но и более портативный. C и C ++ не гарантируют представление ASCII, но они гарантируют, что независимо от того, какое представление используется, представления десяти десятичных цифр являются смежными и в числовом порядке.
Ben Voigt 17 апр. 2017, в 00:16

Lundin · Answer 4 · 2011-02-17T15-19-00.000Z

char - всего 1 байтовое целое число. В char нет ничего волшебного! Так же, как вы можете назначить короткий для int или int long, вы можете назначить char для int.

Да, имя примитивного типа данных оказывается "char", что указывает на то, что оно должно содержать только символы. Но на самом деле "char" - это просто плохой выбор имени, чтобы смутить всех, кто пытается выучить язык. Лучшее имя для него - int8_t, и вы можете использовать это имя вместо этого, если ваш компилятор следует последнему стандарту C.

Хотя при обработке строк вы должны использовать тип char, потому что индекс классической таблицы ASCII соответствует 1 байту. Тем не менее, вы могли бы обрабатывать строки с помощью обычных ints, хотя в реальном мире нет практической причины, почему вы когда-либо захотите это сделать. Например, следующий код будет работать отлично:

  int str[] = {'h', 'e', 'l', 'l', 'o', '\0' };

  for(i=0; i<6; i++)
  {
    printf("%c", str[i]);
  }

Вы должны понимать, что символы и строки - это просто цифры, как и все остальное на компьютере. Когда вы пишете 'a' в исходном коде, он предварительно обрабатывается в число 97, которое является целочисленной константой.

Итак, если вы пишете выражение типа

char ch = '5';
ch = ch - '0';

это фактически эквивалентно

char ch = (int)53;
ch = ch - (int)48;

который затем проходит целые рекламные акции на языке C

ch = (int)ch - (int)48;

а затем усечен до char, чтобы соответствовать типу результата

ch = (char)( (int)ch - (int)48 );

Там много таких тонких вещей, которые происходят между строками, где char неявно рассматривается как int.

Поскольку вопрос не помечен ascii , вы не должны предполагать какую-либо конкретную кодировку. Установка char равной int8_t , неверна, поскольку она также может быть uint8_t или uint24_t .
@RolandIllig Нет, char всегда равен 1 байту, и если в int8_t uint8_t существуют типы int8_t / uint8_t (что весьма вероятно), они смогут соответствовать результату char , потому что тогда он будет 8 бит. В очень экзотических системах, таких как различные устаревшие DSP, char будет 16 бит, а uint8_t не будет. Написание кода для совместимости с устаревшими DSP не имеет смысла, так же как написание для совместимости с системами дополнения или знака и величины. Огромная трата времени, поскольку такие системы практически не существуют в реальном мире.

Fred Nurk · Answer 5 · 2011-02-17T17-52-00.000Z

(Этот ответ относится к С++ стороне вещей, но проблема расширения знака существует и в C.)

Обработка всех трех типов char (подписанный, неподписанный и "char" ) более деликатный, чем первый. Значения в диапазоне от 0 до SCHAR_MAX (что составляет 127 для 8-бит char):

char c = somevalue;
signed char sc = c;
unsigned char uc = c;
int n = c;

Но когда какое-то значение выходит за пределы этого диапазона, только просмотр без знака char дает согласованные результаты для "тех же" char значений во всех трех типах:

char c = somevalue;
signed char sc = c;
unsigned char uc = c;
// Might not be true: int(c) == int(sc) and int(c) == int(uc).
int nc = (unsigned char)c;
int nsc = (unsigned char)sc;
int nuc = (unsigned char)uc;
// Always true: nc == nsc and nc == nuc.

Это важно при использовании функций из <ctype> , таких как isupper или toupper, из-за расширения знака:

char c = negative_char;  // Assuming CHAR_MIN < 0.
int n = c;
bool b = isupper(n);  // Undefined behavior.

Обратите внимание, что преобразование через int неявно; это имеет тот же UB:

char c = negative_char;
bool b = isupper(c);

Чтобы исправить это, перейдите в unsigned char, что легко сделать с помощью функций wrapping <ctype> через safe_ctype:

template<int (&F)(int)>
int safe_ctype(unsigned char c) { return F(c); }

//...
char c = CHAR_MIN;
bool b = safe_ctype<isupper>(c);  // No UB.

std::string s = "value that may contain negative chars; e.g. user input";
std::transform(s.begin(), s.end(), s.begin(), &safe_ctype<toupper>);
// Must wrap toupper to eliminate UB in this case, you can't cast
// to unsigned char because the function is called inside transform.

Это работает, потому что любая функция, берущая любой из трех типов char, может также принимать два других типа char. Это приводит к двум функциям, которые могут обрабатывать любой из типов:

int ord(char c) { return (unsigned char)c; }
char chr(int n) {
  assert(0 <= n);  // Or other error-/sanity-checking.
  assert(n <= UCHAR_MAX);
  return (unsigned char)n;
}

// Ord and chr are named to match similar functions in other languages
// and libraries.

Ord (c) всегда дает вам неотрицательное значение - даже если он прошел отрицательный char или отрицательный знак char - и chr принимает любое значение ord производит и возвращает тот же самый char.

На практике я, скорее всего, просто использовал бы беззнаковые char вместо их использования, но они вкратце завершают листинг, обеспечивают удобное место для добавления проверки ошибок для int-to-w9812 > и будут короче и более ясно, когда вам нужно использовать их несколько раз в непосредственной близости.

herohuyongtao · Answer 6 · 2014-01-22T05-48-00.000Z

Используйте static_cast<int>:

int num = static_cast<int>(letter); // if letter='a', num=97

Изменить: Вероятно, вам следует избегать использования ~~(int)~~

~~int num = (int) letter;~~

проверить Зачем использовать static_cast <int> (x) вместо (int) x? для получения дополнительной информации.

T.E.D. · Answer 7 · 2011-02-17T15-41-00.000Z

Это зависит от того, что вы подразумеваете под "convert".

Если у вас есть серия символов, которая представляет целое число, например "123456", тогда есть два типичных способа сделать это на C: используйте специальное преобразование, например atoi() или strtol() или универсальный sscanf(). С++ (который на самом деле является другим языком, маскирующимся под обновление) добавляет третий, строковый поток.

Если вы хотите, чтобы точная битовая диаграмма в одной из ваших переменных int рассматривалась как char, это проще. В C разные целые типы действительно более состоятельны, чем фактические отдельные "типы". Просто начните использовать его там, где запрашивается char, и вы должны быть в порядке. Возможно, вам понадобится явное преобразование, чтобы заставить компилятор иногда выходить из-за нытья, но все, что нужно сделать, это сбросить любые дополнительные биты за 256.

Henke · Answer 8 · 2017-05-10T17-35-00.000Z

У меня есть абсолютно навыки null в C, но для простого разбора:

char* something = "123456";

int number = parseInt(something);

... это сработало для меня:

int parseInt(char* chars)
{
    int sum = 0;
    int len = strlen(chars);
    for (int x = 0; x < len; x++)
    {
        int n = chars[len - (x + 1)] - '0';
        sum = sum + pow(n, x);
    }
    return sum;
}

int powInt(int x, int y)
{
    for (int i = 0; i < y; i++)
    {
        x *= 10;
    }
    return x;
}

Этот код быстро вызывает неопределенное поведение и поэтому не подходит для копирования и вставки. (переполнение int)

Cheers and hth. - Alf · Answer 9 · 2011-02-17T15-04-00.000Z

Предположительно вы хотите использовать это преобразование для использования функций из стандартной библиотеки C.

В этом случае выполните (синтаксис С++)

typedef unsigned char UChar;

char myCppFunc( char c )
{
    return char( someCFunc( UChar( c ) ) );
}

Выражение UChar( c ) преобразуется в unsigned char, чтобы избавиться от отрицательных значений, которые, кроме EOF, не поддерживаются функциями C.

Тогда результат этого выражения используется как фактический аргумент для формального аргумента int. Где вы получаете автоматическое продвижение до int. Вы можете в качестве альтернативы написать этот последний шаг явно, например int( UChar( c ) ), но лично я нахожу это слишком подробным.

Приветствия и hth.,

Riwels · Answer 10 · 2012-10-26T06-49-00.000Z

Для char или short для int вам просто нужно назначить значение.

char ch = 16;
int in = ch;

То же самое для int64.

long long lo = ch;

Все значения будут 16.

Mathorlaz · Answer 11 · 2011-11-16T19-57-00.000Z

У меня возникли проблемы с преобразованием массива char типа "7c7c7d7d7d7d7c7c7c7d7d7d7d7c7c7c7c7c7c7d7d7c7c7c7c7d7c7d7d7d7c7c2e2e2e" в его фактическое целочисленное значение, которое могло бы быть представлено символом `7C 'как одно шестнадцатеричное значение. Итак, после круиза за помощью я создал это и подумал, что было бы круто поделиться.

Это разделяет строку char на ее правые целые числа и может быть полезной для большего количества людей, чем просто для меня;)

unsigned int* char2int(char *a, int len)
{
    int i,u;
    unsigned int *val = malloc(len*sizeof(unsigned long));

    for(i=0,u=0;i<len;i++){
        if(i%2==0){
            if(a[i] <= 57)
                val[u] = (a[i]-50)<<4;
            else
                val[u] = (a[i]-55)<<4;
        }
        else{
            if(a[i] <= 57)
                val[u] += (a[i]-50);
            else
                val[u] += (a[i]-55);
            u++;
        }
    }
    return val;
}

Надеюсь, что это поможет!

Вы когда-нибудь проверяли этот код? 50 должно быть 48, 55 работает только для прописных букв ASCII, в то время как ваш пример содержит строчные буквы.