java-Match шаблон регулярного выражения в строке (перечисление совпадающих и не совпадающих частей)

Question

java-Match шаблон регулярного выражения в строке (перечисление совпадающих и не совпадающих частей)

1

У меня есть строка csv, содержащая пять полей (3 обязательных и 2 необязательных). Необязательные поля находятся в позиции 3 и 5. У меня есть шаблон регулярного выражения для идентификации строк в двойных кавычках

    private static final String TEXT_IN_DBL_QUOTES_REGEX="\"([^\"]*)\"";
    private static final String rowData="\"Field1\", \"Field2\", , \"Field4\", ";

    public static void main(String[] args){
        List<String> fields = Lists.newArrayList();
        Pattern regex = Pattern.compile(TEXT_IN_DBL_QUOTES_REGEX);
        Matcher matcher = regex.matcher(rowData);
        while(matcher.find()){
           fields.add(matcher.group(1));
        }
        return fields;
    }

My expected result is an array list containing 
Field1, Field2, null, Field4, null
but the above is returning 
Field1, Field2, Field4

Как я могу настроить вышеуказанный код, чтобы получить желаемый результат?

Rob 25 март 2015, в 15:33

Источник

0

Использование приведенного выше регулярного выражения все равно дало мне следующие «Доменное имя», «13test.com», «USer5», ==> [Domain Name, 13test.com, USer5]
Rob 25 март 2015, в 14:16
0

почему бы не использовать CSV Reader, который имеет полную поддержку полей в кавычках? opencsv.sourceforge.net
dognose 25 март 2015, в 14:35
0

Архитектурно я не могу использовать этот вызов API до тех пор, пока API не будет одобрен для использования в нашей среде, и, кроме того, в качестве разделителя в качестве разделителя есть неоднозначность, потому что в качестве значения поля у меня есть разделенный запятыми текст. Спасибо за ответ, хотя ...
Rob 25 март 2015, в 15:12
0

CSV-Lib также может обрабатывать строки, содержащие ",".
dognose 27 март 2015, в 13:38

Показать ещё 2 комментария

Теги:

java

string

regex

match

1 ответ

Ещё вопросы

Использование приведенного выше регулярного выражения все равно дало мне следующие «Доменное имя», «13test.com», «USer5», ==> [Domain Name, 13test.com, USer5]
почему бы не использовать CSV Reader, который имеет полную поддержку полей в кавычках? opencsv.sourceforge.net
Архитектурно я не могу использовать этот вызов API до тех пор, пока API не будет одобрен для использования в нашей среде, и, кроме того, в качестве разделителя в качестве разделителя есть неоднозначность, потому что в качестве значения поля у меня есть разделенный запятыми текст. Спасибо за ответ, хотя ...
CSV-Lib также может обрабатывать строки, содержащие ",".

anubhava · Accepted Answer · 2015-03-25T11-59-00.000Z

Вы можете настроить свое регулярное выражение следующим образом:

String TEXT_IN_DBL_QUOTES_REGEX="\"([^\"]*)\"|(?<=,) *(?=,|$)";
String rowData="\"Field1\", \"Field2\", , \"Field4\", ";

List<String> fields = new ArrayList<>();
Pattern regex = Pattern.compile(TEXT_IN_DBL_QUOTES_REGEX);
Matcher matcher = regex.matcher(rowData);
while(matcher.find()) {
    fields.add(matcher.group(1));
}
System.out.println (fields);

Вывод:

[Field1, Field2, null, Field4, null]

Пожалуйста, рад, что это сработало.
Но это терпит неудачу, если строка внутри csv должна содержать " , например "Field1", "This is ""quoted""", , "Field4" - в соответствии со стандартами csv двойная кавычка внутри поля двойных кавычек должен предшествовать двойная кавычка.
Для таких случаев лучше использовать библиотеку парсеров CSV.
на данный момент мои требования не допускают, чтобы строка содержала двойные кавычки, так что пока я в порядке с решением