Извлечение из форматированной строки с использованием Java

Question

Извлечение из форматированной строки с использованием Java

1

У меня есть строки следующих форматов:

[(xx) (KEY1) некоторый текст]
Некоторый текст [(yy) (KEY1) некоторый текст]
Некоторый текст [(qq) (KEY1) некоторый текст] Больше текста здесь [(zz) (KEY2) некоторый текст] и т.д.

В основном форма [(xx) (KEYX) некоторый текст] появляется один или несколько раз в строке, смешанной с другими символами.

В вышеуказанном формате ключ - это KEYX, а значение - некоторый текст.

Я хотел бы извлечь все пары ключевых значений из любой строки, содержащей любое количество таких форматов.

Я попытался использовать прямой синтаксический анализ, используя подстроку и т.д., Но это не кажется чистым решением. Можно ли сделать это лучше, используя регулярное выражение или любую другую технику, которую предоставляет Java?

naspras 26 нояб. 2014, в 17:15

Источник

0

KEYX всегда 4 символа? Это всегда начинается с третьего символа?
Elliott Frisch 26 нояб. 2014, в 16:10
0

KEYX - это переменная строка. Может принимать любое строковое значение. Но он всегда заключен в (). Это всегда третий персонаж. Значения префикса (xx) или (yy) в точности такие.
naspras 26 нояб. 2014, в 16:15

Теги:

java

string

regex

parsing

2 ответа

0

Если я понимаю ваш вопрос, вы можете положиться на KEY начиная с четвертого символа, а затем найти следующий ")", как

String str = "(xx)(KEY1)some text";
int open = str.indexOf("(", 4);
int pos = str.indexOf(")", 4);
str = str.substring(open + 1, pos);
System.out.println(str);

Выход

KEY1

Elliott Frisch 26 нояб. 2014, в 13:40

Ещё вопросы

KEYX всегда 4 символа? Это всегда начинается с третьего символа?
KEYX - это переменная строка. Может принимать любое строковое значение. Но он всегда заключен в (). Это всегда третий персонаж. Значения префикса (xx) или (yy) в точности такие.

brso05 · Accepted Answer · 2014-11-26T13-46-00.000Z

Вы можете использовать регулярное выражение и совпадение, чтобы найти свой ключ и значение:

     public static void main(String[] args) throws IOException
     {
         String test = "[(xx)(KEYX)some text]";
         Pattern pattern = Pattern.compile("\\(KEY.*\\)");

         Matcher matcher = pattern.matcher(test);
         matcher.find();
         String s = matcher.group(0);
         String s1 = test.substring(matcher.end(), test.length() - 1);
         System.out.println("" + s + "   " + s1);

     }

Результатом этого будет:

(KEYX)   some text

Если вы измените строку на "[(xx)(KEYXYYYYYY)some text]" то это будет:

(KEYXYYYYYY)   some text

Если вы не хотите скобки вокруг ключа:

 public static void main(String[] args) throws IOException
 {
     String test = "[(xx)(KEYXYYYYYY)some text]";
     Pattern pattern = Pattern.compile("(?<=\\()KEY.*(?=\\))");

     Matcher matcher = pattern.matcher(test);
     matcher.find();
     String s = matcher.group(0);
     String s1 = test.substring(matcher.end() + 1, test.length() - 1);
     System.out.println("" + s + "   " + s1);

 }

Результатом будет:

KEYXYYYYYY   some text

************************************************** ************ОБНОВИТЬ************************************* ********************* Сопоставьте что-нибудь для ключа не только КЛЮЧ:

 public static void main(String[] args) throws IOException
 {
     String test = "[(xx)(time.zone1)some text]";
     Pattern pattern = Pattern.compile("(?<=\\()[^xy].*(?=\\))");

     Matcher matcher = pattern.matcher(test);
     matcher.find();
     String s = matcher.group(0);
     String s1 = test.substring(matcher.end() + 1, test.length() - 1);
     System.out.println("" + s + "   " + s1);

 }

Это приведет к выводу:

time.zone1   some text

************************************************** ********ОБНОВИТЬ***************************************** *****

Несколько совпадений в одной строке:

 public static void main(String[] args) throws IOException
 {
     String test = "[(xx)(time1.zone1)some text1]blahblahblah[(xx)(time2.zone2)some text2]";
     Pattern pattern = Pattern.compile("(?<=\\()[^xy].*?]");

     Matcher matcher = pattern.matcher(test);
     while(matcher.find())
     {
         String s = matcher.group(0);
         String s1 = s.substring((s.indexOf(")") + 1), (s.length() - 1));
         s = s.substring(0, s.indexOf(")"));
         System.out.println("" + s + "   " + s1);
     }

 }

Это приведет к выводу:

time1.zone1   some text1
time2.zone2   some text2

Спасибо, brso5. Хотя одна вещь. Ключ не начинается со строки «КЛЮЧ». Это может быть что угодно. Например, все действительные ключи следующие: time.zone1; url.someval; Some.key.val и т. д.
@naspras Эй, парень, я только что обновил его, чтобы вы соответствовали любому ключу, а не только тому, который начинается с KEY ... посмотрите раздел обновления
Я был в отъезде последние пару дней. Это решение полезно для того, что мне нужно. Спасибо!
Добро пожаловать рад, что я мог помочь!
Это не работает, если у меня есть входные данные как это: некоторый текст [(XX) (A.KEY) some_text] напишите бла-бла [(XX) (OTHER.VAL) some_more_text] привет привет. Простое намерение - найти ключи (A.KEY, OTHER.VAL) после каждого вхождения (XX).
То есть вы имеете в виду все в одной строке? Вы должны использовать цикл с совпадением ... Я могу опубликовать код для этого.
Я был бы признателен, что. Спасибо!
@naspras только что обновил сообщение, ознакомьтесь с новейшим кодом, мне пришлось немного изменить регулярное выражение, это должно работать для вас ...
Спасибо! Я получил его на работу, а также :). Спасибо за быструю помощь. +1 за это.
Добро пожаловать, я рад, что наконец-то все заработало!