GAE массовая загрузка программно

1

У меня есть python script, который предназначен для запуска на моем локальном компьютере каждую ночь. Цель состоит в том, чтобы вытащить данные с стороннего сервера, выполнить некоторую обработку на нем и выполнить массовую загрузку в хранилище данных GAE.

Моя проблема хотя и горячая для загрузки массовой загрузки из python script. Все примеры, которые я видел (в том числе документацию Google), используют командную строку "appcfg.py upload_data...", и, насколько я вижу, appcfg.py и bulkloader.py не выставляют API, который гарантированно не изменится.

Мои два параметра, которые я вижу сейчас, это либо выполнить команду "appcfg.py upload_data..." из моего python script, что кажется окольным путем. Или напрямую вызвать внутренние методы appcfg.py, что означает, что я должен перекодировать сообщения в случае их изменения.

Теги:
google-app-engine
google-cloud-datastore

2 ответа

2
Лучший ответ

Appengine может выполнять задания cron. Все, что вам нужно, это написать один script, который вытаскивает данные с стороннего сервера и загружает его в механизм appengine, Appenigne сделает все для вас. Appengine cron у этого есть все, что вам нужно знать о запуске работы cron в appengine

  • 0
    Причина, по которой я решил использовать Навалдер, состоит в том, что данные, которые я получаю, находятся в нескольких файлах CSV. С некоторыми минимальными настройками, Bulloader делает всю работу по загрузке их для меня. Насколько я понимаю, если я использую задание cron, мне придется самому разбирать файлы, создавать и сохранять объекты сущностей. Я бы, вероятно, прикусил бы пулю и использовал бы cron, если нет никакого способа обойти это.
  • 0
    как насчет запуска bulkuploader.py с использованием cron ....
Показать ещё 3 комментария
1

Этот ответ устарел. См. Ниже ссылку на мой последний ответ для массовой загрузки данных в движок приложения.

Как загрузить данные навалом в хранилище appengine? Старые методы не работают

Ещё вопросы

Сообщество Overcoder
Наверх
Меню