так что в основном, я создаю программу, где я беру список субредадов из Reddit и в настоящее время храню их в txt файле. однако, я не знаю, как считать дубликаты. Поэтому, если я запустил его, и есть имя, которое уже находится в файле, как я могу добавить "1" к значению? так что это может быть похоже: subone: 1 subtwo: 3 subthree: 2
и так далее...
вот что у меня есть:
class Isduplicate:
def read(self):
f = open(r'C:\Users\jacka\OneDrive\Documents\outputs.txt', "r")
contents = f.read()
return contents
while counter < len(elem):
e = str(elem[counter].get_attribute("href"))
e = e.replace("https://www.reddit.com/r/", "")
e = e[:-1]
if e in Is.read():
text_file.write("duplicate found")
else:
text_file.write(e + "\n")
print(e)
counter = counter +2
любые общие советы также приветствуются!
Вы не хотите использовать список для этого типа операции. Вы хотите использовать словарь. Сделайте свой ключ субреддитным именем и значением числа упоминаний subreddit. Это лучше всего запустить, создав словарь из файла, а затем переписывая файл каждый раз, когда вы его запустите.
collections.Counter
. collections.Counter
. РЕДАКТИРОВАТЬ: Doh, @EvanBenn сказал это 3 минуты назад! : D
pandas
. В нем много утилит для конвертации текстовых файлов в файлы и в них (csvs) и манипулирования данными.