LJ export, a mere python script
**Table of Contents**How it works
This a Python script which can download and store posts from LiveJournal server. There is no need to login or authorise on the server, thus any public journal can be downloaded for a selected period of time. Images and (non-collapsed) comments may be stored on demand as well.
For more details use Google Translate (or any other auto-translator RU→EN) to read the rest of documentation.
С места в карьер
Программа сохраняет публичные записи из какого-либо дневника ЖЖ (LiveJournal) за требуемый период. Дополнительно также можно сохранит отклики и/или картинки в записях. Программа русифицирована и должна сама переключится на русский язык если он выбран на системном уровне.
Для работы достаточно:
- Загрузить на компьютер имеющийся релиз программы в предпочтительной форме. При необходимости выполнить шаги по установке.
- Запустить программу
LJexport
. Если необходимая информация не была задана в командной строке, то программа начнёт диалог с пользователем в терминале. По ходу диалога будут даны необходимые подсказки для правильного ввода параметров. В первый раз запустите загрузку всего за один месяц—просто на пробу. - Когда начнётся исполнение, достаточно долго (несколько минут) экран не будет меняться—это нормально. О продвижении сообщается только по завершению всей загрузки за целый месяц.
- По завершению задания в рабочем каталоге должна быть создана папка с полученной информацией, см. подробнее ниже. Впрочем, если по ходу возникли какие-либо проблемы мы не вешаем нос.
- По итогу на экране появится подробный отчёт о найденных записях/картинках и результатах их загрузки.
Предположив, что предыдущие шаги (по крайней мере, с помощью указанных по ссылкам текстов) были успешны, обратимся к полученным результатам.
Что мне с этого будет?
Все загруженное складируются в подкаталогах рабочей директории, т.е. той, откуда был вызов программы. Там создаётся (если не существовала до этого) папка, названная так же, как и загружаемый дневник ЖЖ. Далее вкладываются папки по годам и внутри них—по месяцам.
HTML файлы записей
Если загружалась не только статистика, но и записи дневника, то созданные для них HTML файлы распределяются по помесячным папкам. HTML файлы создаются по одному на каждую запись дневника.
Попутно из кода вычищается разный мусор. В остатке — вы получаете сохранёнными только то, составляет собственно запись в дневнике. Но здесь может понадобиться ваше участие в настройках этого очищения.
Внешний вид
Внешний вид сохранённых записей и откликов управляется коротким стилевым ( CSS) файлом ljexport.css
в корневой папке загруженного дневника. Вы можете редактировать его по своему усмотрению, что бы поменять отображение записей. Если вы решите догрузить в ту же папку больше записей этого пользователя за другой период, то существующий стилевой файл (с вашими возможными правками) не будет переписан и изменения останутся в силе. Если вы хотите сделать какие-либо изменения постоянными во всех последующих загрузках, то внесите их в конфигурацию.
Отчёты
За каждый год и месяц формируются (и помещаются в соответствующие папки) отчёты о наличие/загрузке и содержании записей/картинок. Отчёты сохраняются в любом случае, даже если записи, картинки и отзывы не грузились.
Картинки
Если вы выбирали скачивания картинок (либо в диалоге, либо указанием ключ -i
командной строки), то все ссылки на изображения автоматически проверяются на доступность, которая вносится в отчёты. Все доступные (с места и времени запуска скрипта, что может меняться) картинки скачиваются и их пути в загруженных записях меняются на локальные. По умолчанию, картинки сохраняются в подкаталоге imgs
в папке текущего для записи месяца. Это может быть по желанию изменено в конфигурации.
Отклики
Можно запросить сохранение откликов к загружаемым записям—либо во время диалога, либо задав ключ -c
командной строки. Отклики будут сохранены в отдельных HTML файлах, если откликов много, то они будут распределены по нескольким файлам. Файлы отдельной записи и все файлы откликов к ней (если таковые имеются) будут связаны перекрёстными ссылками. Свёрнутые отклики (на данный момент) не разворачиваются и просто представлены в ветках именами сделавшими их пользователей. Картинки из откликов не сохраняются локально, остаются внешние ссылки на них. Все файлы с откликами помещаются в подкатолог comnts
внутри соответствующей помесячной папки. Это тоже может быть по желанию изменено в конфигурации.
Подзамочные записи и т.д.
Подзамочные записи не грузятся, так как для этого в скрипт надо добавить модуль авторизации, что на данный момент не сделано. Так же не могут быть сохранены записи помеченные их авторами категорией «для взрослых».
Дополнительная информация
Вики проекта содержит дополнительную информацию по
- Установке программы
- Варианты запуска программы
- Возможных затруднений и вариантов их преодоления
- Как выглядят записи ЖЖ изнутри
- Что указано в отчётах
- Что пользователь может легко подкрутить
Авторы
Исходная программа создана j-cth (источник: https://github.com/sferukshtu/livejou).
Впоследствии, код и документация изменялись V.V.Kisil.
Лицензия
Данный проект имеет открытый код и лицензирован согласно условиям описанным в файле LICENSE.
Описание
Скрипт на Питоне для загрузки и сохранения записей с LiveJournal. It is a Python script to download and save locally posts from LiveJournal server. There is no need to authorise or login to server, any public journal can be download for a desired period of time.