Я пишу диссертацию и использую nltk.pos_tagger в своей работе. Я не могу найти никакой информации о точности этого алгоритма. Кто-нибудь знает, где я могу найти такую информацию?
NLTK
default tag tagger pos_tag
- тег MaxEnt, см. строку 82 из https://github.com/nltk/nltk/blob/разработка/NLTK/тег/ INIT.py
from nltk.corpus import brown
from nltk.data import load
sents = brown.tagged_sents()
# test on last 10% of brown corpus.
numtest = len(sents) / 10
testsents = sents[numtest:]
_POS_TAGGER = 'taggers/maxent_treebank_pos_tagger/english.pickle'
tagger = load(_POS_TAGGER)
print tagger.evaluate(testsents)
[выход]:
MaxEnt tagger
является ответом на точность?