0
<< предыдущая заметкаследующая заметка >>
19 декабря 2009
Спасаем убитые блоги из кэша

Сделал модуль loadlj — возрождение убитых и удаленных блогов из кэша Яндекса. Настроено это работать с аккаунтами livejournal. Делал для себя — у меня на аккаунте lleo осталось много постов и комментариев, которые терять не хотелось. Я его держал в замороженном состоянии, эпизодически отзывая заявку на удаление, но как-то отвлекся на полгодика, аккаунт все-таки убили и захватили враги. Но по идее наверно можно вообще вынимать из кэша любые блоги и запихивать в движок.

Пример работы: http://lleo.aha.ru/bloglj/2008/03/16_19-38.html Из минусов — комментарии идут без нумерации и в обратном порядке (пока было лень морочиться, все равно это чинить надо не в момент скачивания, а позже), а навигация только через ссылку слева «содержание» (навигация «предыдущая-следующая заметка» не работает, это сейчас вообще проблема движка, которую я скоро решу). Таким же способом восстановил ЖЖ Бачило: http://lleo.aha.ru/bachilo/contents/

По установке: инсталлируется в наш стандартный дневниковый движок (уже есть в апдейте на репозитарии), сам аккаунт юзера (бывшего юзера) livejournal указывается в config.php: $admin_ljuser="lleo"; Также надо обновить модуль /include_sys/_obracom.php, иначе не будут отображаться юзерпики в комментариях (да, именно ;) и /include_sys/_autorize.php (там с кэшем более корректная работа стала). Да, и конечно в директории /tmp проследите, чтобы обязательно была папка get с правами на запись - туда ложится кэш всего, что качается. Для отладки это было просто необходимо, вам не нужно, но в модуле осталось. Как закончится, можно кэш удалить. Выглядит этот процесс так: админ открывает страницу /loadlj и уходит на час. За это время страница перегружается сама множество раз и аккуратно раз в две секунды подалбливается в Яндекс, собирая сперва все посты (это довольно быстро), а затем все комментарии к ним (в зависимости от стажа блога и популярности это может растянуться на час).

Предвидя вопросы: нет, система не предназначена для бэкапа и вытягивания блогов с livejournal — нахуй мне не надо с тамошним сервером разговаривать, он дурной и имеет привычку банить по IP за частые запросы. Блог собирается из кэша Яндекса, это будет полезно тем, чей блог удалился (как мой), был засуспенжен или взломан (как у Бачило). Также, разумеется, вы сможете собрать компромат на любого врага и захватить Вселенную ;)

<< предыдущая заметка следующая заметка >>
пожаловаться на эту публикацию администрации портала
архив понравившихся мне ссылок
Оставить комментарий
Linux Ubuntu Firefox
0
0
batc0h
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
папку get в /tmp можно было бы создавать силами скрипта, если file_exists( "/tmp/get" ) вернет false.

config.sys лучше переименовать в config.php, ибо в случае, если к файлу забудется применить запрет на доступ, то вызов из браузера не покажет никаких данных, а просто выполнит скрипт.


может что-то еще, но надо качать скрипт...
Linux
whois*: title='{#countryname}
Чертаново{Россия'> {city:|:{#countryname}|*:Чертаново{Россия|}}
0
1
LLeo
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
На многих хостингах у php по умолчанию нет прав на запись.

config.php он и называется, а я как написал?
Linux Firefox
1
0
batc0h
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
Оффтоп. В 27 строчке last.php нужно поменять условие if($n>0) на if($n>=0), т.к. при первом перелистывании $skip-$LAST_skip дает ноль и ссылка на следующую страницу не появляется.
Linux
whois*: title='{#countryname}
Чертаново{Россия'> {city:|:{#countryname}|*:Чертаново{Россия|}}
0
0
LLeo
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
Пока не понял, но поменял.
Windows Opera
0
0
batc0h
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
К комменту №1. Права на запись есть на любом хостинге, иначе бы сессии не работали. Вопрос в том куда они есть. Где находится местный «tmp» можно выяснить функцией sys_get_temp_dir (есть в 5.2.1+)
Linux
whois*: title='{#countryname}
Чертаново{Россия'> {city:|:{#countryname}|*:Чертаново{Россия|}}
0
0
LLeo
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
Не хочется зависеть от местного tmp - мало ли, где он, и как часто сбрасывается.
Linux Ubuntu Firefox
0
0
batc0h
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
На странице http://lleo.aha.ru/bachilo/lleoblog стоит копирайт Бачило :-)
а вообще круто получается. Но это работает только с более-менее свежими "трупами", а через вебархив так просто не получится?
Linux
whois*: title='{#countryname}
Чертаново{Россия'> {city:|:{#countryname}|*:Чертаново{Россия|}}
0
0
LLeo
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
Естественно, это же копия журнала Бачило. Насчет вебархива - а какова задача? Это модуль по сбору блогов. В вебархиве с блогами не густо.
Windows Firefox
0
1
batc0h
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
туда *кладется* кэш всего, что качается
:)
Linux
whois*: title='{#countryname}
Чертаново{Россия'> {city:|:{#countryname}|*:Чертаново{Россия|}}
1
1
LLeo
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
А еще нельзя произносить слово "тамошний" и "теперича". В народ бы вам, батенька ;)
Windows Safari Chrome
0
0
batc0h
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
Не могу найти способ выкачать тексты (их там пару штук буквально) из этого журнала harmont10blaine.livejournal.com Не знаю что за человек, не ради компромата стараюсь, но уж больно тесты хороши были. Яндекс не помогает совершенно - а я не программист, может поможете?
Linux
whois*: title='{#countryname}
Чертаново{Россия'> {city:|:{#countryname}|*:Чертаново{Россия|}}
0
0
LLeo
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
Вндекс отвечает: "Поиск по сообщениям в блоге «harmont10blaine» запрещен его автором." Запрещен - значит, запрещен, и все.
Windows Safari Chrome
0
0
batc0h
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
Собрали бы Вы такую штуку в отрыве от хостинга, вам бы всякий жеже-юзер немедленно сделал "ку": кто не припомнит любимого, но удалившегося автора, а хостинг заради этого подымать не каждый осилит :)
Linux
whois*: title='{#countryname}
Чертаново{Россия'> {city:|:{#countryname}|*:Чертаново{Россия|}}
0
0
LLeo
Этот человек не загрузил свой юзерпик, и я подобрал ему этот. Человек, пишущий такое, должен именно так выглядеть, верно?
Негоже благородному дону гоняться за юзерскими ку :)

всего комментариев: 14

<< предыдущая заметка следующая заметка >>


Include not found: `/home/www/lleo.me/blog/template/_reklamnaya_lirica.htm`