Добрый день, уважаемые читатели!
Эта статья может пригодится моим коллегам, которые ведут собственные блоги на Дзене параллельно с другим сайтом на WordPress. Те, кто “ведет двойную бухгалтерию”, наверняка знают, как сложно переносить статьи с дзена куда-то еще. Дело в том, что дзен вставляет в html-код целый “вагон и маленькую тележку” мусора, от которого желательно бы избавится. Да, я знаю что классы эти нужны для нормальной работы сайта, но они нужны только для Яндекса, а на WordPress-е будут только мешать. А еще приходится заменять ссылки на изображения, просто ссылки (на другие посты, например) и кое-что ещё. В итоге на перенос всего одной статьи иногда уходил целый вечер.
Для того чтобы облегчить себе жизнь, я написал небольшую утилитку, которая парсит код страницы, удаляет лишние классы, заменяет ссылки и заново собирает уже “чистый” html. Делюсь с вами абсолютно бесплатно.
Теперь за один вечер после работы я смог перенести на свой сайт около десятка статей с Дзена!
Где взять?
Здесь: GitHub – kotyara12/DzenParser. Разумеется, вам понадобится только exe-файл, но можете скачать вместе с исходниками, что-бы посмотреть, что она делает. Установка не требуется. Настройки окон хранятся в реестре.
Как пользоваться?
1. Для начала сохраняем статью с Дзена куда-нибудь на диск “целиком”. Обычно это можно сделать, нажав “Ctrl+S” на клавиатуре. Увы, но полноценную прямую загрузку статьи прямо с сервера, сделать не удалось, так как там все через java.
2. Запускаем утилиту
3. Нажимаем “Открыть” и загружаем в программу сохраненную страницу. При этом программа СРАЗУ ЖЕ удаляет мусорные классы из html-кода, и на вкладке “Dzen текст” код страницы уже частично обработан. При этом в правой части экрана составляются списки изображений и ссылок.
4. Заменяем ссылки на новые. Для изображений можно сделать это “пакетно” – выбрав “Заменить ссылки” из контекстного меню. Это удобно, если вы будете переносить изображения куда-то на другой хостинг. Главное – чтобы собственно имена при переносе файлов не изменились.
5. Нажимаем “Обработка“. Новый html готов, его можно посмотреть на вкладке “Обработанный текст“.
6. Для копирования обработанного html в буфер нажмите “В буфер” или сохраните на диск в виде html-файла.
Важно! У меня wordpress, поэтому форматы изображений заточены под него.
Если нашли ошибку или хочется что-то добавить
Напишите об этом сюда, пожалуйста: Issues · kotyara12/DzenParser
Всем добра и удачи!
Пожалуйста, оцените статью:
Важное примечание! После какого-то обновления на Дзене программа работать перестала, так как теперь весь текст и картинки подгружаются уже после открытия страницы Java скриптом. Так что программа эта стала полностью бесполезна.
Претензии направлять владельцам и разработчика Дзена 🙂
рабочий вариант здесь – https://zenno.club/discussion/threads/napolnjaem-ru-i-burzh-sajty-unikalnym-kontentom-iz-jandeks-dzen.122086/post-810771