textKit, сателіти та їх автонаповнення

Для мене додавати контент на сайт, навіть самий цікавий, страшна кара. Саме через цю проблему в мене досі немає достойного сайту, хоча я міг би вже давно покорити вершини куди рухатись є. Для економії часу потрібна автоматизація, хай і ціною деяких втрат, наприклад унікальності тексту.

avtorski-prava
КПЗ "Авторські права"

Розповім як я додаю інформацію на пітарду. Сайт перспективний, розкручений і по багатьом СЧ (середньо частотним) запитам в топі. Восени закінчується строк реєстрації домену, і якщо я до того часу щось з ним не зроблю – доведеться продавати. Або просто забути.

Так ось. Є кілька способів додавання туди інформації:

  • тематичні книги, розпізнаються finereader’ом, виправляються помилки, заливаються на сайт за допомогою textKit та xml-імпорта wordpress’у
  • тематичні сайти, просто зберігаються сторінки, додаються в ms word, далі в textKit…
  • тематичні сайти, цікаві статті перекладені через google translate, відредаговані та додані на сайт в windows live writer

Спосіб перший

Для цього способу все просто – беруться тематичні книги, журнали, тощо в будь-якому електронному вигляді, краще звичайно в pdf або djv. Такого хламу багато на торрент.сру, 0day.kiev.ua та leprosorium.ru. Можливо є спеціальні сайти, я не шукав.

Потім з цієї книги береться вибірково кілька речень і намагаєтесь найти їх в Інтернеті. Якщо є ця книга/стаття/журнал – беремо наступну. Якщо ні – в останніх версіях finereader’у є можливість розпізнавати текст з pdf (дежавю доведеться конвертувати в pdf). Далі текст в ms word. Наступні кроки я опишу нижче

Другий спосіб

Звичайно красти інформацію не можна, авторські права та все інше. Тому крадіть те, що крали до вас, або хоча б залишайте посилання на авторів, або як хочете. В мене особисто все залежить від настрою і від враження яке залишив сайт-донор.

Робиться все дуже просто – знаходиться багато сайтів з потрібним контентом, з-за допомогою firefox’у зберігаємо сторінки в на диск в

окрему папочку (звичайно з малюнками). Наступним кроком відкриваємо якимось швидким переглядачем (я використовую lister з комплекту total commaner’а) і швиденько комбінаціями ctrl+c ctrl+v переносимо інформацію в ms word, в один документ, кожна стаття одна за одною. Пам’ятайте, що кожна стаття має мати один заголовок. Що робити далі – читайте нижче.

Третій спосіб

Тут важкого взагалі немає нічого. Стаття => google translate => windows live writer. Виправляються помилки перекладу, форматується за своїм стилем, відшукуються потрібні зображення та додаються в wlw. Зображення бажано обробити (оптимізувати) photoshop’ом – вебмайтри дуже рідко щось оптимізують і на цьому втрачають відвідувачів.  Далі все просто – публікувати на сайті

Звичайно є ще варіанти написати статтю самому. Це найкращий з моральної сторони спосіб, але по витратам часу – один з найгірших. Тому писати самому потрібно тільки при умові що є велике бажання поділитись з кимось своїми думками.

textKit та робота з ним

Робота утиліти основана на трьох етапах, це завантаження контенту в утиліту,  обробка його, редагування, якщо потрібно і експорт отриманого контенту в потрібну вам CMS.

Допустимо ви вже додали текст в ms word, у вас текст йде такими чином – назва розділу (категорія, необов’язково), назва статті та текст. Бажано ще в кожну статтю всунути хоча б однє зображення, а бажано побільше. Далі нам потрібно заголовки розділу позначити html-тегами <h1></h1>, а заголовки статей тегами <h2></h2>. Робиться це доволі просто – дивіться зображення на прикладі мого ms word 2007

poznachati-tegami-word
Стилі форматування "Заголовок 1" і "Заголовок 2" відповідають html тегам h1 і h2 відповідно. Достатньо просто виділити потрібне речення і клацнути на вибраний вами стиль

Потім нам потрібно зберегти наш документ як звичайну html сторінку і імпортувати її в textKit

textkit-import
Тут все просто. Не забувайте поставити категорію та виставити нормальні дати

Що з цього вийшло ви можете побачити на зображенні внизу

textkit-import-adfter
Малюнки не видно, але вони є.

Я спеціально взяв невідформатований текст і додав у ms word, там і шрифти різні, і кольори і дуже багато проблем різних в стилі. Після обробки textKit’ом все стало на свої місця. Єдина проблема це зображення – вони імпортувались, але не відображаються і, якщо нічого не робити,  не додадуться на сайт. Але ми це поборемо трохи пізніше. Також в безкоштовній версії програми немає можливості проставляти автотеги, але для нас це не проблема.

  1. Експортуємо текст у файл xml формату
  2. З папки експортованого проекту нам потрібно перенести всі зображення на наш сервер в папку з зображеннями.

    total-commander-ftp-upload
    Зверніть увагу на адресу, куда завантажуєте
  3. Блокнотом відкриваємо цей xml файл де нам потрібно змінити шлях з локальної папки з зображеннями до нашого серверу. Для цього комбінацією клавіш ctrl + h, заміняємо абсолютні шляхи до локальних файлів шляхами до файлів на сервері. В мене вийшло так

    search-and-replace
    Теж складного нічого немає, звичайна підстановка нових адрес
  4. Далі заходимо в адмінку нашого блогу => Інструменти => Імпорт => WordPress. Імпортуємо файло.
  5. Якщо встановлений плагін Simple Tags – тоді дуже просто буде проставити автоматичні мітки до всіх статей. Йдемо в меню Записи => Автоматичні мітки, а там все просто. Звичайно при умові, якщо Simple Tags само ще не проставило міточки.

Якщо правильно виставлені дати – наші записи заплануються на кілька місяців вперед, зображення будуть проставлені, теги додані і у нас буде час зайнятись чимось іншим -)

Бонусом відеоурок з офіційного сайту з поясненнями – як працювати в програмі.

На відео:

  • Підготовка Word-файлу для імпорту в програму
  • Збереження Word-файла в HTML Word
  • Парсінг збереженого файлу
  • Загальний вигляд редактора програми та візуального представлення зробленої роботи
  • Створення словника позначок і розстановка міток у автоматичному режимі
  • Вставка картинок
  • Збереження в xml-файл експорту WordPress

Мій блог знаходять за наступними запитами

About the author

crazyyy

View all posts

1 Comment

  • То, что надо. Спасибо, вы мне очень помогли, я весь день в поисковиках сижу.