Я хочу проверить, используя Regular-Expression
, содержит ли моя String письмо Marathi.
Любая помощь будет высоко оценен.
Используйте \p{BlockName}
для соответствия символам в указанном блоке Unicode. Чтобы получить название блока для вашего языка, проверьте: Character.UnicodeBlock
Вероятно, \p{InDevaganari}
- это то, что вам нужно.
Вы можете проверить тип символа, пройдя через образец текста и используя Character.UnicodeBlock.of(int codePoint)
чтобы увидеть блок кода символа.
Обратите внимание, что вы должны скомпилировать свой файл с -encoding utf8
опции -encoding utf8
(например, javac -encoding utf8 Main.java
). И вы должны установить весь входной поток для использования кодировки UTF8.