Как удалить из строки все не алфавитно-цифровые символы, кроме тире?

415

Как удалить все не буквенно-цифровые символы из строки, кроме символов пробела и пробела?

Теги:

10 ответов

644
Лучший ответ

Замените [^a-zA-Z0-9 -] пустой строкой.

Regex rgx = new Regex("[^a-zA-Z0-9 -]");
str = rgx.Replace(str, "");
  • 66
    Стоит упомянуть, что - должен быть в конце класса символов или иметь обратную косую черту, чтобы не использовать его для диапазона.
  • 0
    Я использую классический ASP (не C #, поскольку оригинальный вопрос помечен) - если я введу: 50025454 $, это работает нормально, но если я введу 50025454 $$, это не удастся. (Мне нужно добавить + к регулярному выражению). Это то же самое в C #?
Показать ещё 17 комментариев
304

Я мог бы использовать RegEx, они могут обеспечить элегантное решение, но они могут вызывать первоочередные проблемы. Вот одно из решений

char[] arr = str.ToCharArray();

arr = Array.FindAll<char>(arr, (c => (char.IsLetterOrDigit(c) 
                                  || char.IsWhiteSpace(c) 
                                  || c == '-')));
str = new string(arr);

При использовании компактного фреймворка (который не имеет FindAll)

Заменить FindAll с помощью 1

char[] arr = str.Where(c => (char.IsLetterOrDigit(c) || 
                             char.IsWhiteSpace(c) || 
                             c == '-')).ToArray(); 

str = new string(arr);

1Комментарий от ShawnFeatherly

  • 38
    в моем тестировании эта техника была намного быстрее. точнее говоря, это было чуть менее чем в 3 раза быстрее, чем метод Regex Replace.
  • 28
    Также это обрабатывает символы Юникода, а не только US ASCII.
Показать ещё 2 комментария
36

Вы можете попробовать:

   string s1= Regex.Replace(s,"[^A-Za-z0-9 _]","");

Где s - ваша строка.

  • 1
    ОП попросил тире не подчеркнуть
31

Использование System.Linq

string withOutSpecialCharacters = new string(stringWithSpecialCharacters.Where(c =>char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-').ToArray());
  • 3
    Это так же, как этот ответ от трех лет назад.
17

Регулярное выражение [^\w\s\-]*:

\s лучше использовать вместо пространства (), потому что в тексте может быть вкладка.

  • 1
    если вы не хотите удалять вкладки.
  • 0
    ... и переводы строк, и все остальные символы считаются "пробелами".
Показать ещё 6 комментариев
9

Основываясь на ответе на этот вопрос, я создал статический класс и добавил их. Думал, что это может быть полезно для некоторых людей.

public static class RegexConvert
{
    public static string ToAlphaNumericOnly(this string input)
    {
        Regex rgx = new Regex("[^a-zA-Z0-9]");
        return rgx.Replace(input, "");
    }

    public static string ToAlphaOnly(this string input)
    {
        Regex rgx = new Regex("[^a-zA-Z]");
        return rgx.Replace(input, "");
    }

    public static string ToNumericOnly(this string input)
    {
        Regex rgx = new Regex("[^0-9]");
        return rgx.Replace(input, "");
    }
}

Затем методы можно использовать как:

string example = "asdf1234!@#$";
string alphanumeric = example.ToAlphaNumericOnly();
string alpha = example.ToAlphaOnly();
string numeric = example.ToNumericOnly();
  • 1
    Для примера, который вы предоставляете, было бы также полезно, если бы вы предоставили результаты каждого из методов.
4

Я сделал другое решение, исключив символы Control, что было моей первоначальной проблемой.

Лучше, чем вставить в список все "специальные, но хорошие" символы

char[] arr = str.Where(c => !char.IsControl(c)).ToArray();    
str = new string(arr);

это проще, поэтому я думаю, что это лучше!

1

Хотите что-то быстро?

public static class StringExtensions 
{
    public static string ToAlphaNumeric(this string self, params char[] allowedCharacters)
    {
        return new string(Array.FindAll(self.ToCharArray(), c => char.IsLetterOrDigit(c) || allowedCharacters.Contains(c)));
    }
}

Это позволит вам указать, какие символы вы хотите разрешить.

0

Я использую вариант одного из ответов здесь. Я хочу заменить пробелы "-", поэтому его SEO дружественный, а также сделать более строгим. Также не ссылайтесь на system.web из уровня моих сервисов.

private string MakeUrlString(string input)
{
    var array = input.ToCharArray();

    array = Array.FindAll<char>(array, c => char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-');

    var newString = new string(array).Replace(" ", "-").ToLower();
    return newString;
}
0

В Regex гораздо проще.

private string FixString(string str)
{
    return string.IsNullOrEmpty(str) ? str : Regex.Replace(str, "[\\D]", "");
}
  • 1
    заменяет только нечисловые символы

Ещё вопросы

Сообщество Overcoder
Наверх
Меню