парсинг изображения, чтобы получить из него информацию

Question

парсинг изображения, чтобы получить из него информацию

0

Несколько дней я размышлял о трехпозиционной работе

а. получение б. разбор с. сохраняя несколько страниц.

Два дня назад я думал, что получение страниц будет главной задачей. Нет, это не так - я думаю, что работа-синтаксис будет героической задачей. Каждая из страниц, которые должны быть проанализированы, представляет собой png-изображение.

Итак, вопрос в том, что - после того, как все получилось. Как их разобрать!? Кажется, это проблема. Угадайте, что есть некоторые perl-модули, которые могут помочь в этом...

Ну, я думаю, что эта работа может быть выполнена только с встроенным OCR! Вопрос: есть ли perl-модуль, который можно использовать здесь для поддержки этой задачи:

BTW: см. страницы результатов.

BTW;: и, как я думал, я могу найти все 790 результирующих страниц в определенном диапазоне между Id = 0 и Id = 100000 я думал, что я могу идти по пути с циклом:

http://www.foundationfinder.ch/ShowDetails.php?Id=11233&InterfaceLanguage=&Type=Html http://www.foundationfinder.ch/ShowDetails.php?Id=927&InterfaceLanguage=1&Type=Html http://www.foundationfinder.ch/ShowDetails.php?Id=949&InterfaceLanguage=1&Type=Html http://www.foundationfinder.ch/ShowDetails.php?Id=20011&InterfaceLanguage=1&Type=Html http://www.foundationfinder.ch/ShowDetails.php?Id=10579&InterfaceLanguage=1&Type=Html

Я думал, что смогу пойти на Perl-Way, но я не очень уверен: Я пытался использовать LWP:: UserAgent по тем же URL-адресам [см. Ниже] с разными аргументами запроса, и мне интересно, поддерживает ли LWP:: UserAgent путь для нас, чтобы перебрать аргументы запроса? Я не уверен, что у LWP:: UserAgent есть метод для этого. Ну, я иногда слышал, что проще использовать Mechanize. Но действительно ли это проще?

Но - быть откровенным; первая задача "ПОЛУЧИТЬ ВСЕ страницы не очень сложно - если мы сравним эту задачу с разбором... Как это можно сделать!?

Любые идеи - предложения -

ожидаем услышать от вас...

нулевым

zero 17 май 2011, в 00:19

Источник

3

Это должен быть Perl? Возможно, вам лучше использовать пакет OCR, специализирующийся на распознавании макетов.
Pekka 웃 16 май 2011, в 21:51
0

Здравствуйте, дорогой Му, слишком коротко: спасибо за исправление тегов. Ну отлично. Кстати, я люблю ваш сайт: торты такие классные. И ваша философия ошеломляет! привет, Пекка, хорошо - большое спасибо за ответ qukck. Ну, это не обязательно Perl. Но я думаю - Часть, чтобы получить материал, может быть сделана с Perl. После этого мне нужно запустить какой-нибудь OCR. - Как вы думаете !? Вы имеете в виду какое-нибудь распознавание текста? С нетерпением ждем ответа от Вас!!
zero 16 май 2011, в 22:00
1

Извините, у меня нет конкретного продукта, но я уверен, что он есть. Но на смежной ноте, у кого была идея поместить этот вид данных в изображения ? Я никогда не видел ничего подобного раньше. Вы уполномочены очищать данные? Если да, разве не должно быть способа получить реальные текстовые данные?
Pekka 웃 16 май 2011, в 22:05
0

привет, дорогой Пекка, у меня нет ответа на вопрос о том, как поместить данные в изображения. Противные парни там. Но с разрешениями - у меня нет проблем. Фундаментер является бесплатным для использования. Все, что я делаю, - это механизирую «чтение» - что-то вроде некоторой (высокой) скорости чтения. Я мог читать страницу за страницей - это было бы очень очень медленно. Если я использую Perl для поддержки процесса извлечения (получения), я могу ускорить выполнение некоторых задач. Так что я думаю, что нет никаких юридических проблем .... все дело в том, чтобы делать вещи проще с Perl ...
zero 16 май 2011, в 22:34

Показать ещё 2 комментария

Теги:

mysql

image

perl

ocr

1 ответ

Ещё вопросы

Это должен быть Perl? Возможно, вам лучше использовать пакет OCR, специализирующийся на распознавании макетов.
Здравствуйте, дорогой Му, слишком коротко: спасибо за исправление тегов. Ну отлично. Кстати, я люблю ваш сайт: торты такие классные. И ваша философия ошеломляет! привет, Пекка, хорошо - большое спасибо за ответ qukck. Ну, это не обязательно Perl. Но я думаю - Часть, чтобы получить материал, может быть сделана с Perl. После этого мне нужно запустить какой-нибудь OCR. - Как вы думаете !? Вы имеете в виду какое-нибудь распознавание текста? С нетерпением ждем ответа от Вас!!
Извините, у меня нет конкретного продукта, но я уверен, что он есть. Но на смежной ноте, у кого была идея поместить этот вид данных в изображения ? Я никогда не видел ничего подобного раньше. Вы уполномочены очищать данные? Если да, разве не должно быть способа получить реальные текстовые данные?
привет, дорогой Пекка, у меня нет ответа на вопрос о том, как поместить данные в изображения. Противные парни там. Но с разрешениями - у меня нет проблем. Фундаментер является бесплатным для использования. Все, что я делаю, - это механизирую «чтение» - что-то вроде некоторой (высокой) скорости чтения. Я мог читать страницу за страницей - это было бы очень очень медленно. Если я использую Perl для поддержки процесса извлечения (получения), я могу ускорить выполнение некоторых задач. Так что я думаю, что нет никаких юридических проблем .... все дело в том, чтобы делать вещи проще с Perl ...

snoofkin · Accepted Answer · 2011-05-16T21-14-00.000Z

Я бы предложил использовать Image::OCR::Tesseract

У меня был хороший опыт работы с Tesseract в прошлом с использованием С++.

Подробнее см. .

добрый день soulSurfer 2010 большое спасибо я попробую это! Милле Грейзи!