ImportError: нет модуля с именем textract

1

Я установил textract using pip install и выполнил команду import в jupyter notebook, которая выдает следующую ошибку.

Я нахожусь на Windows-машине и имею две версии python, установленных (2.7 и 3.6), используя conda. Я также добавил пути к переменным среды, как это было предложено в других сообщениях, но все еще получаю ошибку.

import textract

ImportErrorTraceback (most recent call last)
<ipython-input-2-99b3b0e1733d> in <module>()
     1 #Code to extract pdf files
----> 2 import textract
    3 text = textract.process("C:/Users/username/Documents/Projects/Attachments/PDF/fileA.pdf")

ImportError: No module named textract 

РЕДАКТИРОВАТЬ:

Мне удалось установить textract на python 2.7. Я добавил следующие пути к переменным среды C:\Users\Username\AppData\Local\Continuum\anaconda3\envs\mypy27\C:\Users\Username\AppData\Local\Continuum\anaconda3\envs\mypy27\[CN10 ]> здесь находится текстовый файл. C:\Users\Username\AppData\Local\Continuum\anaconda3\envs\mypy27\Lib\lib-tk C:\Users\Username\AppData\Local\Continuum\anaconda3\envs\mypy27\Lib C:\Users\Username\AppData\Local\Continuum\anaconda3\envs\mypy27\DLLs

ОБНОВЛЕНИЕ: я установил pypdf2, используя pip install, и попытался импортировать его в ноутбуки juptyer. Он возвратил ту же ошибку. Мне было интересно, неправильно ли я устанавливаю вещи.

Теги:
importerror
packages

2 ответа

0

Это работает для меня на Ubuntu

1. Открытый терминал

python -m venv env 
source ./env/bin/activate
sudo apt update
sudo apt install python-pip && pip install --upgrade pip
sudo apt install python-dev libxml2-dev libxslt1-dev antiword unrtf poppler-utils pstotext tesseract-ocr flac ffmpeg lame libmad0 libsox-fmt-mp3 sox libjpeg-dev swig
pip install textract

если вы столкнулись с какими-либо еще ошибками:

пытаться

pip install https://pypi.python.org/packages/ce/c7/ab6cd0d00ddf8dc3b537cfb922f3f049f8018f38c88d71fd164f3acb8416/SpeechRecognition-3.6.3-py2.py3-none-any.whl
sudo apt install libpulse-dev
pip install textract

Теперь вы сможете импортировать textract

import textract
text = textract.process("/home/user/textract_test.pdf")
0

Это может быть обходным путем.

1.Установите Anaconda и заново установите его.

2. Не создайте в anaconda среду python 2.7 и повторно установите textract с помощью pip вместе со всеми другими зависимостями в командной строке базы данных anaconda.

3. Попробовал импортировать textract и работал как шарм!

Ещё вопросы

Сообщество Overcoder
Наверх
Меню