У меня есть файл CSV объемом 2 ГБ с 9 М-записями, которые я импортирую в MongoDB, используя собственный инструмент mongoimport. Он импортирует CSV со скоростью 8K в секунду. Общее время составляет 10 минут. Скорость импорта довольно разумная, но, похоже, она намного медленнее, чем версия MySQL LOAD DATA INFILE (занимает всего 2 минуты, чтобы вставить все записи в базу данных). Хотя это приемлемо (MongoDB построен для объектов типа JSON, и ускорения обычно запрашиваются, а не вставляются), я хотел бы знать, есть ли способ ускорить количество вставок в секунду, выполненное в MongoDB mongoimport? У меня есть только один компьютер с 8 ГБ оперативной памяти и 4 ядра. Благодарю.
Поскольку большинство времени, скорее всего, потрачено на сериализацию объектов JSON в BSON (собственный формат MongoDB), вы, скорее всего, получите более быстрый импорт, если сможете разделить свой файл и иметь несколько параллельных заданий, каждый из которых запускает mongoimport с отдельным файлом.