Я борюсь с этим куском кода. Мне нужно создать 1 и 2 граммовую модель и сопоставить граммы с их частотой; После того, как мне нужно записать 2 модели в один файл EXCEL на двух разных листах... Я прихожу сюда, показывая грамм и частоту 2 моделей, но пытаюсь понять, как добавить результат и создать файл Excel.
import nltk
nltk.download('punkt')
f = open('data.json','r')
raw = f.read()
tokens = nltk.word_tokenize(raw)
#Create your bigrams
bgs = nltk.bigrams(tokens)
#compute frequency distribution for all the bigrams in the text
fdist = nltk.FreqDist(bgs)
for k,v in fdist.items():
print (k,v)
Спасибо
Этот код экспортирует распределение частот в CSV файл. :
import csv
import nltk
nltk.download('punkt')
f = open('data.json','r')
raw = f.read()
tokens = nltk.word_tokenize(raw)
#Create your bigrams
bgs = nltk.bigrams(tokens)
#compute frequency distribution for all the bigrams in the text
fdist = nltk.FreqDist(bgs)
with open("fdist.csv", "w") as fp:
writer = csv.writer(fp, quoting=csv.QUOTE_ALL)
writer.writerows(fdist.items())