10 месяцев назад История
README.md

Описание

В рамках конкурса для Python-разработчиков от компании О2RUS

ExfromPDF v 0.0.1
Извлекает данные из ПДФ и сохраняет в БД с выгрузкой в csv.

Требования:

  • Python 3.10

Порядок запуска Python скрипта:

  • Клонировать репозиторий
  • Перейти в клонированный репозиторий
  • Создать виртуальное окружение:
  • python3.10 -m venv venv
  • Активировать окружение:
  • venv\Scripts\activate
  • Установить зависимости:
  • pip install -r requrements.txt
  • Запустить скрипт:
  • python ExfromPDF.py
  • Следовать подсказкам в приложении

Либо поступить проще:

  • Запустить ExfromPDF.exe =)

Логика программы:

  • Может парсить только ПДФ со структурой подобной заданному файлу для образца.
  • Для другой структуры нужно будет переписывать
  • Выгрузка делается в базу SQLite3 имя базы задано «output.db»
  • Дополнительно делается выгрузка в csv файл
  • Имя у файла задаётся по формуле:
  • ИМЯ_ПДФ–ТЕКУЩЕЕ_ВРЕМЯ
  • Можно открыть полученный файл кнопкой «открыть CSV»
  • Можно придумать другие фишки и опции
  • Это всё возможно при сотрудничестве ))

При желании можно внести изменения и собрать новую сборку с помощью Nuitka. Запустив builder.bat — дважды щёлкнув в проводнике.

Используемые библиотеки

colorama==0.4.6
loguru==0.7.2
Nuitka==1.7.10
ordered-set==4.1.0
pypdf==4.0.1
PySide2==5.15.2.1
shiboken2==5.15.2.1
win32-setctime==1.1.0
zstandard==0.22.0

© s-evg 2024

Описание

В рамках конкурса для Python-разработчиков от компании О2RUS

Конвейеры
0 успешных
0 с ошибкой