0
<< предыдущая заметкаследующая заметка >>
19 декабря 2009
Спасаем убитые блоги из кэша

Сделал модуль loadlj — возрождение убитых и удаленных блогов из кэша Яндекса. Настроено это работать с аккаунтами livejournal. Делал для себя — у меня на аккаунте lleo осталось много постов и комментариев, которые терять не хотелось. Я его держал в замороженном состоянии, эпизодически отзывая заявку на удаление, но как-то отвлекся на полгодика, аккаунт все-таки убили и захватили враги. Но по идее наверно можно вообще вынимать из кэша любые блоги и запихивать в движок.

Пример работы: http://lleo.aha.ru/bloglj/2008/03/16_19-38.html Из минусов — комментарии идут без нумерации и в обратном порядке (пока было лень морочиться, все равно это чинить надо не в момент скачивания, а позже), а навигация только через ссылку слева «содержание» (навигация «предыдущая-следующая заметка» не работает, это сейчас вообще проблема движка, которую я скоро решу). Таким же способом восстановил ЖЖ Бачило: http://lleo.aha.ru/bachilo/contents/

По установке: инсталлируется в наш стандартный дневниковый движок (уже есть в апдейте на репозитарии), сам аккаунт юзера (бывшего юзера) livejournal указывается в config.php: $admin_ljuser="lleo"; Также надо обновить модуль /include_sys/_obracom.php, иначе не будут отображаться юзерпики в комментариях (да, именно ;) и /include_sys/_autorize.php (там с кэшем более корректная работа стала). Да, и конечно в директории /tmp проследите, чтобы обязательно была папка get с правами на запись - туда ложится кэш всего, что качается. Для отладки это было просто необходимо, вам не нужно, но в модуле осталось. Как закончится, можно кэш удалить. Выглядит этот процесс так: админ открывает страницу /loadlj и уходит на час. За это время страница перегружается сама множество раз и аккуратно раз в две секунды подалбливается в Яндекс, собирая сперва все посты (это довольно быстро), а затем все комментарии к ним (в зависимости от стажа блога и популярности это может растянуться на час).

Предвидя вопросы: нет, система не предназначена для бэкапа и вытягивания блогов с livejournal — нахуй мне не надо с тамошним сервером разговаривать, он дурной и имеет привычку банить по IP за частые запросы. Блог собирается из кэша Яндекса, это будет полезно тем, чей блог удалился (как мой), был засуспенжен или взломан (как у Бачило). Также, разумеется, вы сможете собрать компромат на любого врага и захватить Вселенную ;)

<< предыдущая заметка следующая заметка >>
пожаловаться на эту публикацию администрации портала
архив понравившихся мне ссылок
Оставить комментарий