Символ новой строки CSV, видимый в поле без кавычек

Question

Символ новой строки CSV, видимый в поле без кавычек

113

следующий код работал до сегодняшнего дня, когда я импортировал с компьютера Windows и получил эту ошибку:

символ новой строки, видимый в некотируемом поле - вам нужно открыть файл в режиме универсальной-новой строки?

import csv

class CSV:


    def __init__(self, file=None):
        self.file = file

    def read_file(self):
        data = []
        file_read = csv.reader(self.file)
        for row in file_read:
            data.append(row)
        return data

    def get_row_count(self):
        return len(self.read_file())

    def get_column_count(self):
        new_data = self.read_file()
        return len(new_data[0])

    def get_data(self, rows=1):
        data = self.read_file()

        return data[:rows]

Как я могу исправить эту проблему?

def upload_configurator(request, id=None):
    """
    A view that allows the user to configurator the uploaded CSV.
    """
    upload = Upload.objects.get(id=id)
    csvobject = CSV(upload.filepath)

    upload.num_records = csvobject.get_row_count()
    upload.num_columns = csvobject.get_column_count()
    upload.save()

    form = ConfiguratorForm()

    row_count = csvobject.get_row_count()
    colum_count = csvobject.get_column_count()
    first_row = csvobject.get_data(rows=1)
    first_two_rows = csvobject.get_data(rows=5)

GrantU 26 июнь 2013, в 08:58

Источник

0

Ответ rectummelancolique ниже - вот что решило мою похожую проблему. stackoverflow.com/a/17315726/3131666
kmantel 09 янв. 2015, в 00:10

Теги:

django

python

csv

8 ответов

51

Я понимаю, что это старый пост, но я столкнулся с той же проблемой и не вижу правильного ответа, поэтому попробую

Ошибка Python:

_csv.Error: new-line character seen in unquoted field

Вызывается попыткой чтения файлов CSV Macintosh (предварительно отформатированных в OS X). Это текстовые файлы, которые используют CR для конца строки. Если вы используете MS Office, убедитесь, что вы выбрали простой формат CSV или CSV (MS-DOS). Не используйте CSV (Macintosh) как тип сохранения.

Моя предпочтительная версия EOL будет LF (Unix/Linux/Apple), но я не думаю, что MS Office предоставляет возможность сохранять в этом формате.

g.kovatchev 11 янв. 2015, в 20:22

4

MS DOS Comma Separated не работает для меня (та же ошибка), но Windows Comma Separated.
tmthyjames 21 май 2015, в 15:48
3

Если вы на Mac, это абсолютно правильный ответ.
HashHazard 30 июнь 2015, в 17:48
0

Я получаю ту же проблему на OS X. Мне приходится создавать новый файл CSV. Простое сохранение текущего в простом формате CSV или CSV (MS-DOS) не решает проблему.
Pyderman 13 фев. 2016, в 14:48
1

В OS X Windows Comma Separated csv работал, MS DOS Comma Separated - нет.
user2348114 09 фев. 2017, в 02:14

Показать ещё 2 комментария

31

Для Mac OS X сохраните CSV файл в формате "Windows Comma Separated (.csv)".

BoltzmannBrain 21 май 2015, в 18:25

1

спасибо, это был необходимый компонент, так как я использую Mac с MS Office.
travelingbones 24 фев. 2016, в 19:50

18

Если это произойдет с вами на mac (как это было со мной):

Сохраните файл как CSV (MS-DOS Comma-Separated)

Запустите следующий script

with open(csv_filename, 'rU') as csvfile:
    csvreader = csv.reader(csvfile)
    for row in csvreader:
        print ', '.join(row)

Nimo 28 сен. 2015, в 16:44

1

Вы только что потрясли мой мир.
kta 05 июнь 2018, в 20:14

5

Попробуйте запустить dos2unix в ваших первых файлах с файлами Windows

rectummelancolique 26 июнь 2013, в 10:16

0

на самом деле нет опции, которая мне нужна, чтобы позволить пользователю загружать csv с Windows и Mac без каких-либо специальных изменений. Импорт был сохранен из Excel (Windows) в формате CSV, так что, возможно, в Python нужно что-то сделать, чтобы прочитать их?
GrantU 26 июнь 2013, в 09:02
0

@GrantU Вы имеете в виду Mac OS X 10.0 или более поздней версии, а не Mac OS 9 или более ранней, правильно? В период с 9 по 10 Mac OS переключается с \x0d (ProDOS) на окончания строк \x0a (UNIX).
Damian Yerrick 28 нояб. 2016, в 18:03

2

Это ошибка, с которой я столкнулся. Я сохранил CSV файл в MAC OSX.

Во время сохранения сохраните его как "Разделимые значения Windows (CSV)", которые разрешили проблему.

Suraj 08 март 2017, в 02:07

1

Это работало для меня на OSX.

# allow variable to opened as files
from io import StringIO

# library to map other strange (accented) characters back into UTF-8
from unidecode import unidecode

# cleanse input file with Windows formating to plain UTF-8 string
with open(filename, 'rb') as fID:
    uncleansedBytes = fID.read()
    # decode the file using the correct encoding scheme
    # (probably this old windows one) 
    uncleansedText = uncleansedBytes.decode('Windows-1252')

    # replace carriage-returns with new-lines
    cleansedText = uncleansedText.replace('\r', '\n')

    # map any other non UTF-8 characters into UTF-8
    asciiText = unidecode(cleansedText)

# read each line of the csv file and store as an array of dicts, 
# use first line as field names for each dict. 
reader = csv.DictReader(StringIO(cleansedText))
for line_entry in reader:
    # do something with your read data

Resonance 28 окт. 2016, в 16:42

0

Я знаю, что на это ответили довольно долгое время, но не решили мою проблему. Я использую DictReader и StringIO для чтения csv из-за некоторых других осложнений. Я смог решить проблему проще, просто заменив разделители:

with urllib.request.urlopen(q) as response:
    raw_data = response.read()
    encoding = response.info().get_content_charset('utf8') 
    data = raw_data.decode(encoding)
    if '\r\n' not in data:
        # proably a windows delimited thing...try to update it
        data = data.replace('\r', '\r\n')

Не может быть разумным для огромных файлов CSV, но хорошо работал для моего использования.

Dougyfresh 01 дек. 2018, в 00:47

Ещё вопросы

Ответ rectummelancolique ниже - вот что решило мою похожую проблему. stackoverflow.com/a/17315726/3131666
MS DOS Comma Separated не работает для меня (та же ошибка), но Windows Comma Separated.
Если вы на Mac, это абсолютно правильный ответ.
Я получаю ту же проблему на OS X. Мне приходится создавать новый файл CSV. Простое сохранение текущего в простом формате CSV или CSV (MS-DOS) не решает проблему.
В OS X Windows Comma Separated csv работал, MS DOS Comma Separated - нет.
спасибо, это был необходимый компонент, так как я использую Mac с MS Office.
на самом деле нет опции, которая мне нужна, чтобы позволить пользователю загружать csv с Windows и Mac без каких-либо специальных изменений. Импорт был сохранен из Excel (Windows) в формате CSV, так что, возможно, в Python нужно что-то сделать, чтобы прочитать их?
@GrantU Вы имеете в виду Mac OS X 10.0 или более поздней версии, а не Mac OS 9 или более ранней, правильно? В период с 9 по 10 Mac OS переключается с \x0d (ProDOS) на окончания строк \x0a (UNIX).

alecxe · Accepted Answer · 2013-06-26T09-17-00.000Z

Будет хорошо видеть сам файл csv, но это может сработать для вас, попробуйте, замените:

file_read = csv.reader(self.file)

с:

file_read = csv.reader(self.file, dialect=csv.excel_tab)

Или, откройте файл с помощью universal newline mode и передайте его на csv.reader, например:

reader = csv.reader(open(self.file, 'rU'), dialect=csv.excel_tab)

Или используйте splitlines(), например:

def read_file(self):
    with open(self.file, 'r') as f:
        data = [row for row in csv.reader(f.read().splitlines())]
    return data

Это теперь дает ту же ошибку, но в режиме онлайн, начиная с upload.num_records = csvobject.get_row_count ()
и когда я пробую версию с разделенными строками (что очень здорово, спасибо), я получаю принуждение к Unicode: нужна строка или буфер, найден S3BotoStorageFile
Какой вариант в итоге сработал? Кстати, вы читаете файл дважды: в get_row_count() и в get_column_count() - рассмотрите возможность чтения файла в __init__ и запомните data в self.data , а затем используйте его в других методах.
+1 для splitline (), которая позволяет избежать возни с различными вариантами форматирования в OSX. Надеюсь, что это работает и на других платформах ...
Отличный ответ. Однако, используя - "dialect = csv.excel_tab", можно испортить вывод при использовании csv.DictReader. Просто опции 'rU' работают магически, хотя
csv.reader (open (self.file, 'rU')) Решил мою проблему!