Решение для хранения 300 МБ в памяти для Google App Engine

Question

Решение для хранения 300 МБ в памяти для Google App Engine

1

Я использую Google App Engine в Python. У меня 5000 человек в моей базе данных. Весь список объектов из 5000 человек занимает до 300 МБ памяти.

Я пытаюсь сохранить это в памяти, используя blobcache, модуль, написанный [здесь] [1].

Я сталкиваюсь с проблемами "OutOfMemory" и ищу решение, которое включает в себя хранение этих 5000 объектов в базе данных и последующее извлечение их всех сразу.

Моя персональная модель выглядит так.

class PersonDB(db.Model):
    serialized = db.BlobProperty()
    pid = db.StringProperty()

Каждый человек является объектом, который имеет много атрибутов и методов, связанных с ним, поэтому я решил рассорить каждый объект и сохранить его как сериализованное поле. Pid просто позволяет мне запрашивать человека по их идентификатору. Мой человек выглядит примерно так

class Person():
    def __init__(self, sex, mrn, age):
       self.sex = sex;
       self.age = age; #exact age
       self.record_number = mrn;
       self.locations = [];

    def makeAgeGroup(self, ageStr):
       ageG = ageStr
       return int(ageG)

    def addLocation(self, healthdistrict):
        self.locations.append(healthdistrict)

Когда я сохраняю все 5000 человек сразу в мою базу данных, я получаю ошибку Server 500. Кто-нибудь знает, почему? Мой код для этого выглядит следующим образом:

   #People is my list of 5000 people objects
def write_people(self, people):
    for person in people:
        personDB = PersonDB()
        personDB.serialized = pickle.dumps(person)
        personDB.pid = person.record_number
        personDB.put()

Как я могу получить все 5000 из этих объектов сразу в моем методе App Engine?

Моя идея - сделать что-то вроде этого

def get_patients(self):
    #Get my list of 5000 people back from the database
    people_from_db = db.GqlQuery("SELECT * FROM PersonDB")
    people = []
    for person in people_from_db:
        people.append(pickle.loads(person.serialized))

Спасибо за помощь заранее, я застрял на этом какое-то время!

John Lunky 30 июнь 2011, в 23:14

Источник

0

«Когда я храню все 5000 человек одновременно в своей базе данных, я получаю ошибку Server 500» - какую конкретную ошибку вы получаете?
matt b 30 июнь 2011, в 20:34
0

Ошибка: ошибка сервера. Сервер обнаружил ошибку и не смог выполнить ваш запрос. Если проблема сохраняется, сообщите о своей проблеме и укажите это сообщение об ошибке и запрос, который ее вызвал.
John Lunky 30 июнь 2011, в 20:38
0

Однако, когда я смотрю статистику для своего приложения, я вижу, что есть экземпляры моего PersonDB. Однако я не могу сказать, все ли 5000 были добавлены в мою базу данных. Как мне это проверить?
John Lunky 30 июнь 2011, в 20:38
0

Я имею в виду ошибку в журналах - ошибку, трассировку стека сообщений и т. Д., О которых сообщает Python.
matt b 30 июнь 2011, в 20:39
6

Почему? Почему вы думаете, что вам нужно все 5000 в памяти одновременно? Как вы думаете, почему лучше выбирать объекты и сохранять их, а не использовать очень db.Expando инструменты (например, db.Expando ), которые предоставляет GAE? Почему? Почему?
Daniel Roseman 30 июнь 2011, в 20:54
0

Как @Daniel, я запутался, почему кто-то хотел бы сделать это.
Nick Johnson 01 июль 2011, в 01:27

Показать ещё 4 комментария

Теги:

python

google-app-engine

google-cloud-datastore

memcached

3 ответа

Ещё вопросы

«Когда я храню все 5000 человек одновременно в своей базе данных, я получаю ошибку Server 500» - какую конкретную ошибку вы получаете?
Ошибка: ошибка сервера. Сервер обнаружил ошибку и не смог выполнить ваш запрос. Если проблема сохраняется, сообщите о своей проблеме и укажите это сообщение об ошибке и запрос, который ее вызвал.
Однако, когда я смотрю статистику для своего приложения, я вижу, что есть экземпляры моего PersonDB. Однако я не могу сказать, все ли 5000 были добавлены в мою базу данных. Как мне это проверить?
Я имею в виду ошибку в журналах - ошибку, трассировку стека сообщений и т. Д., О которых сообщает Python.
Почему? Почему вы думаете, что вам нужно все 5000 в памяти одновременно? Как вы думаете, почему лучше выбирать объекты и сохранять их, а не использовать очень db.Expando инструменты (например, db.Expando ), которые предоставляет GAE? Почему? Почему?
Как @Daniel, я запутался, почему кто-то хотел бы сделать это.

recursive · Answer 1 · 2011-06-30T18-41-00.000Z

У вас не должно быть сразу 5000 пользователей в памяти. Только извлеките тот, который вам нужен.

PanosJee · Answer 2 · 2011-07-08T12-05-00.000Z

Вы также можете проверить производительность проекта appheng https://github.com/ocanbascil/PerformanceEngine

Jan Z · Answer 3 · 2011-07-03T08-40-00.000Z

Для такого размера данных, почему бы не использовать blobstore и memcache?

С точки зрения производительности (от наивысшего до самого низкого):

локальная память экземпляра (слишком большой набор данных)
memcache (разделите свои данные на несколько клавиш, и все будет хорошо, и это очень быстро!)
blobstore + memcache (сохраняется в blobstore, а не в DB)
db + memcache (сохраняются до db)

Просмотрите видеоролики Google IO с этого года, есть отличная возможность использовать blobstore для такого рода вещей. Для некоторых случаев использования существует значительная производительность (и стоимость), связанная с БД.

(для педантичных читателей показатели чтения последних трех будут практически одинаковыми, но есть существенные различия в времени записи/стоимости)