Новая версия нового парсера

Написал crazyyy

Категории: новости, софт

0

Саша! Запомните: когда человек ворует из одного источника или из двух, это ужасно, это плагиат; когда человек берет, ну, скажем, из пяти источников, это уже терпимо, это компиляция, а вот если из шести и более - это уже прекрасно, это - эрудиция! (реплика студенту шестого курса А. Муратову).

Александр Владимирович Гальперин

anti-kopipast Alpha parser представляет из себя скоростной спуск контента из блогов, для дальнейшего массового импорта в различные CMS. Он не требует настройки шаблонов или т.п. Нужно просто указать тему статей для поиска и начать парсинг. В настоящий момент он полностью бесплатный. Вышла Версия 1.7 . Из нововведений-синонимизация (теперь парсер может сам синонимизировать тексты Есть быстрый вариант с котроткой базой и более медленный. Если что, базы можно исправить. Файлы syn_s и syn_b). Так же исправил баг с пустыми ответами от яндекса.

Возможности программы можно просмотреть инбоксе

Список функций:

  1. Парсинге по заданному слову или выражения. Теперь результаты можно сортировать по дате публикации или по релевантности. При этом во время сортировки по дате результаты более содержательные.
  2. Парсинг статей заданной категории. При этом отбираются только статьи указанной категории или метки.
  3. Экспорт в отдельные html файлы, rss ленту или html файл для последующего импорта в zebroid или WPT, либо в свой формат из шаблона.
  4. Теперь можно парситы блоги, блоги целиком (статьи и комментарии из блогов), записи из блогов, записи с микроблогов, комментарии из блогов и микроблогов, форумы, все блоги и форумы.
  5. Можно обирать определенный сервис (livejournal т.п.) или даже отдельный блог.
  6. Функция замены слов в тексте. (Файл replace.txt в папке парсер Для замены слова «пользователь» на «читатель» добавьте туда строку «пользователь = читатель», без кавычек)
  7. Рядом с каждой функцией есть вопрос, при нажатии на который вы получите краткую справку.
  8. Удаление повторов. Парсер автоматически удаляет 90% повторных статей в случае если одна статья размещена на нескольких сервисах.
  9. Добавлении стоп слова. (Файл stop_slova.txt в папке парсера Писать надо по одному слову в строке. Если одно из этих слов встречается в тексте статьи то статья не сохраняется. Регистр значения не имеет.)
  10. Можно парситы собрание списка url статей, или запросов.
  11. Можно установить лимит постов или количества символов в тексте.
  12. Предварительный просмотр постов позволяет вручную отбирать нужные записи.
  13. Автоматическая синонимизация текстов внутри парсера.

Родственные записи