Регулярное выражение для записей LAS

Question

Регулярное выражение для записей LAS

1

Я очень плохо отношусь к RegEx. Может ли кто-нибудь помочь мне получить RegEx для этого шаблона.

Вот шаблон

(Слова). (Одиночный символ, может быть пустым) (пробелы) (слова, могут быть пустыми) :( Слова могут быть пустыми)

Вот примеры

VERS. 2.00: Ver 2.00
WRAP. NO:
STRT.F                  4501.0000:START DEPTH
WELL. C5 1H:WELL
FTG GTG. :LOCATION FOOTAGE DESCRIPTION

Обновление 1:

Вот что я сделал.

string re1 = "((?:[a-z][a-z]+))";   // Word 1
string re2 = ".*?"; // Non-greedy match on filler
string re3 = "(\\.)";   // Any Single Character 1
string re4 = "(.)"; // Any Single Character 2
string re5 = "(\\s+)";  // White Space 1
string re6 = "((?:[a-z][a-z]+))";   // Word 2
string re7 = ".*?"; // Non-greedy match on filler
string re8 = "(:)"; // Any Single Character 3
string re9 = ".*?"; // Non-greedy match on filler
string re10 = "(?:[a-z][a-z]+)";    // Uninteresting: word
string re11 = ".*?";    // Non-greedy match on filler
string re12 = "((?:[a-z][a-z]+))";  // Word 3

Regex r = new Regex(re1 + re2 + re3 + re4 + re5 + re6 + re7 + re8 + re9 + re10 + re11 + re12, RegexOptions.IgnoreCase | RegexOptions.Singleline);

Обновление 2:

Хорошо. Я пробовал что-то новое. Вот мое регулярное выражение.

(\.)(.)(\s+)(4501.0000)(:)

Вот вход.

STRT DTG.F                  4501.0000:START DEPTH

И вот вывод.

STRT DTG
.
F

4501.0000
:
START DEPTH

Теперь мне нужно только заменить 4501.0000 регулярным выражением для предложения (например, "некоторый текст" или "еще какой-то текст")

Faisal Hafeez 27 авг. 2014, в 10:04

Источник

0

возможно, вам нужно сначала проверить спецификацию LAS (WORDS). не обязательно верно, это может быть пробел после (WORDS)spacespacespace.
Yuliam Chandra 27 авг. 2014, в 07:55
0

Мы сделали некоторые изменения в LAS. Так что это не формат LAS (можно сказать, вдохновленный),
fhnaseer 27 авг. 2014, в 08:03
0

@YuliamChandra Возможно ли, что в строке LAS есть два двоеточия ":" ?,
fhnaseer 27 авг. 2014, в 08:46
0

исходя из моего понимания, это невозможно, я написал конвертер пару лет назад, ваше регулярное выражение может быть примерно таким : первый мнем, второй блок, третий данные, четвертый
Yuliam Chandra 27 авг. 2014, в 08:54
0

@YuliamChandra мое понимание было то же самое, но что, если мы храним значение даты / времени. Это может иметь форму 11:12:35.
fhnaseer 27 авг. 2014, в 09:05
0

@YuliamChandra это регулярное выражение идеально. Это не покрывает проблему времени, которую я написал в предыдущем комментарии. Я сделаю некоторые исследования, что это возможно или нет. Спасибо,
fhnaseer 27 авг. 2014, в 09:08
0

формат времени должен быть частью раздела данных, и вы можете использовать другое регулярное выражение для раздела данных, в вашем случае это только раздел заголовка, я думаю, и формат данных разделен запятой, что было бы намного проще без регулярного выражения, вы нужно прочитать полную спецификацию, я мог ошибиться, вспоминая эти спецификации
Yuliam Chandra 27 авг. 2014, в 09:13
0

@YuliamChandra Я нашел случай, когда регулярное выражение не работает. Для этого ввода «VCLAY.V / V 123: объем глины» Обратите внимание, что V / V - это единица, но выражение возвращает V как единицу, а «V 123» в значении, вы можете помочь мне исправить регулярное выражение?
fhnaseer 28 авг. 2014, в 11:02

Показать ещё 6 комментариев

Теги:

c#

regex

2 ответа

0

используйте \s или "", чтобы включить пробелы. Что-то вроде

     ((?:[a-z][a-z\s]+))

или

      ((?:[a-z][a-z ]+))

vks 27 авг. 2014, в 06:37

Ещё вопросы

возможно, вам нужно сначала проверить спецификацию LAS (WORDS). не обязательно верно, это может быть пробел после (WORDS)spacespacespace.
Мы сделали некоторые изменения в LAS. Так что это не формат LAS (можно сказать, вдохновленный),
@YuliamChandra Возможно ли, что в строке LAS есть два двоеточия ":" ?,
исходя из моего понимания, это невозможно, я написал конвертер пару лет назад, ваше регулярное выражение может быть примерно таким : первый мнем, второй блок, третий данные, четвертый
@YuliamChandra мое понимание было то же самое, но что, если мы храним значение даты / времени. Это может иметь форму 11:12:35.
@YuliamChandra это регулярное выражение идеально. Это не покрывает проблему времени, которую я написал в предыдущем комментарии. Я сделаю некоторые исследования, что это возможно или нет. Спасибо,
формат времени должен быть частью раздела данных, и вы можете использовать другое регулярное выражение для раздела данных, в вашем случае это только раздел заголовка, я думаю, и формат данных разделен запятой, что было бы намного проще без регулярного выражения, вы нужно прочитать полную спецификацию, я мог ошибиться, вспоминая эти спецификации
@YuliamChandra Я нашел случай, когда регулярное выражение не работает. Для этого ввода «VCLAY.V / V 123: объем глины» Обратите внимание, что V / V - это единица, но выражение возвращает V как единицу, а «V 123» в значении, вы можете помочь мне исправить регулярное выражение?

Yuliam Chandra · Accepted Answer · 2014-08-27T08-19-00.000Z

Раздел заголовка файла LAS (обычно) имеет такой формат.

<MNEM> .<UNIT> <DATA> : <DESCRIPTION>

Регулярное выражение может быть таким.

^([\w\s]*)\s*\.([^ ]*)\s*([^:]*)\s*:(.*)$

объяснение

^         -> beginning of line
([\w\s]*) ->   1st group, MNEM (take words and/or space)
\s*       -> space
\.        -> period delimiter
([^ ]*)     ->   2nd group, UNIT (take everything until it sees space)
\s*       -> space
([^:]*)   ->   3rd group, DATA (take everything until it sees colon)
\s*       -> space
:         -> colon delimiter
(.*)      ->   4th group, DESCRIPTION (take everything)
$         -> end of line

DEMO

Спасибо, сайт регулярных выражений является пригородом,
@FaisalHafeez, я редактирую шаблон, меняю \w на [^ ] исходя из предположения, что UNIT и DATA разделены пробелом
спасибо, я также изменил выражение, но это возвращало 5 токенов, ваше новое изменение прекрасно решает проблему.