Java регулярное выражение для удаления всех символов, кроме шаблона

Question

Java регулярное выражение для удаления всех символов, кроме шаблона

1

У меня есть строка, включая электронную почту. Вероятно, есть дополнительные символы до и/или после него. примеры ввода:

[email protected]
[email protected] abcd efg
x y z [email protected]
p q [email protected] x z
asd[[email protected]]gh

Я хочу удалить лишние символы.

Требуемые выходы:

[email protected]
[email protected]
[email protected]
[email protected]
[email protected]

Допустимыми символами являются a-zA-Z0-9._ Таким образом, вероятно, недопустимые символы до и/или после электронной почты.

Я пробовал этот код, чтобы определить, является ли он правильным письмом или нет (предполагается, что он отделен от лишних символов пробелом), но я не могу заменить нужную строку (используя s.replaceAll()):

if (s.matches("(?i).*\\s[a-zA-Z_\\.]+@[a-zA-Z_\\.]+\\.[a-zA-Z_\\.]+.*") ||
    fields[2].matches("(?i).*[a-zA-Z_\\.]+@[a-zA-Z_\\.]+\\.[a-zA-Z_\\.]+\\s.*"))

Alisa 28 авг. 2014, в 21:25

Источник

3

Прочитайте это
Reimeus 28 авг. 2014, в 19:03
2

Не используйте matches и не replaceAll . Вместо этого установите Matcher , используйте find (который найдет шаблон в любом месте строки) и используйте group(0) чтобы вернуть найденную строку. Намного легче будет сказать, чтобы она возвращала совпавшую строку, чем сказать, чтобы она удаляла несопоставленные символы.
ajb 28 авг. 2014, в 19:04
1

Допустимые символы: a-zA-Z0-9._ ... Как ваше регулярное выражение соответствует 12345 в адресах электронной почты в желаемом выводе ??
hwnd 28 авг. 2014, в 19:08
0

Допустимые символы: a-zA-Z0-9._ Отредактировано.
Alisa 28 авг. 2014, в 19:11
2

Вам, вероятно, лучше всего использовать это регулярное выражение: \ S @ \ S Ваше регулярное выражение пропустит тонну действительных адресов электронной почты. В адресе электронной почты допустимо много допустимых символов.
tobii 28 авг. 2014, в 19:21
0

Мой адрес электронной почты: [email protected] . Это совершенно действительный адрес электронной почты. Ваше регулярное выражение не позволит этого.
Qix 28 авг. 2014, в 19:28
0

@tobii, Qix: Мой вопрос был не о проверке персонажей. Поскольку я определил набор допустимых символов, я хотел извлечь письмо, упомянутое в подходе Nemo.
Alisa 28 авг. 2014, в 20:59

Показать ещё 5 комментариев

Теги:

java

string

regex

email

3 ответа

0

Проверка адресов электронной почты невозможна. Это возможно только для проверки адреса электронной почты-адресата - и даже эта задача довольно сложная, из-за новых tld с более чем 3-мя символами.

Таким образом, вам лучше найти "недействительные" адреса электронной почты (отправка почты не удалась), а затем отсутствие действительного.

использование

([a-zA-Z0-9!#$%&'*+-/=?^_'{|}~.]+\@(?:[a-zA-Z0-9.-]+|\[[0-9.]+\]))

чтобы захватить все, что может быть адресом электронной почты.

  ([a-zA-Z0-9!#$%&'*+-/=?^_'{|}~.]+\@(?:[a-zA-Z0-9.-]+|\[[0-9.]+\]))

Демоверсия Debuggex

dognose 28 авг. 2014, в 16:36

0

Учитывая ваше определение действительных символов, попробуйте:

^.*?([\w.]+@[\w.]+).*$

и заменить на группу захвата 1

Ron Rosenfeld 28 авг. 2014, в 16:29

Ещё вопросы

Не используйте matches и не replaceAll . Вместо этого установите Matcher , используйте find (который найдет шаблон в любом месте строки) и используйте group(0) чтобы вернуть найденную строку. Намного легче будет сказать, чтобы она возвращала совпавшую строку, чем сказать, чтобы она удаляла несопоставленные символы.
Допустимые символы: a-zA-Z0-9._ ... Как ваше регулярное выражение соответствует 12345 в адресах электронной почты в желаемом выводе ??
Допустимые символы: a-zA-Z0-9._ Отредактировано.
Вам, вероятно, лучше всего использовать это регулярное выражение: \ S @ \ S Ваше регулярное выражение пропустит тонну действительных адресов электронной почты. В адресе электронной почты допустимо много допустимых символов.
Мой адрес электронной почты: [email protected] . Это совершенно действительный адрес электронной почты. Ваше регулярное выражение не позволит этого.
@tobii, Qix: Мой вопрос был не о проверке персонажей. Поскольку я определил набор допустимых символов, я хотел извлечь письмо, упомянутое в подходе Nemo.

Nemo · Accepted Answer · 2014-08-28T18-06-00.000Z

вы можете использовать java.util.regex.Pattern и java.util.regex.Matcher

Этот код будет делать то, что вы просите:

public static void main(String[] args) {
    String[] testList = {"[email protected]", 
            "[email protected] abcd efg", 
            "x y z [email protected]", 
            "p q [email protected] x z", 
            "asd[[email protected]]gh"};

    Pattern EMAIL_PATTERN = Pattern.compile("[_A-Za-z0-9-]+(\\.[_A-Za-z0-9-]+)*@[A-Za-z0-9-]+(\\.[A-Za-z0-9-]+)*(\\.[A-Za-z]{2,})");


    for(String test : testList){
        Matcher m = EMAIL_PATTERN.matcher(test);
        while (m.find()) {
             System.out.println(m.group(0));
        }
    }
}