10 месяцев назад
История
README.md
Описание
В рамках конкурса для Python-разработчиков от компании О2RUS
ExfromPDF v 0.0.1
Извлекает данные из ПДФ и сохраняет в БД с выгрузкой в csv.
Требования:
Python 3.10
Порядок запуска Python скрипта:
- Клонировать репозиторий
- Перейти в клонированный репозиторий
- Создать виртуальное окружение:
python3.10 -m venv venv
- Активировать окружение:
venv\Scripts\activate
- Установить зависимости:
pip install -r requrements.txt
- Запустить скрипт:
python ExfromPDF.py
- Следовать подсказкам в приложении
Либо поступить проще:
- Запустить ExfromPDF.exe =)
Логика программы:
- Может парсить только ПДФ со структурой подобной заданному файлу для образца.
- Для другой структуры нужно будет переписывать
- Выгрузка делается в базу SQLite3 имя базы задано «output.db»
- Дополнительно делается выгрузка в csv файл
- Имя у файла задаётся по формуле:
- ИМЯ_ПДФ–ТЕКУЩЕЕ_ВРЕМЯ
- Можно открыть полученный файл кнопкой «открыть CSV»
- Можно придумать другие фишки и опции
- Это всё возможно при сотрудничестве ))
При желании можно внести изменения и собрать новую сборку с помощью Nuitka. Запустив builder.bat
— дважды щёлкнув в проводнике.
Используемые библиотеки
colorama==0.4.6
loguru==0.7.2
Nuitka==1.7.10
ordered-set==4.1.0
pypdf==4.0.1
PySide2==5.15.2.1
shiboken2==5.15.2.1
win32-setctime==1.1.0
zstandard==0.22.0
© s-evg 2024
Описание
В рамках конкурса для Python-разработчиков от компании О2RUS
Конвейеры
0 успешных
0 с ошибкой