Саша! Запомните: когда человек ворует из одного источника или из двух, это ужасно, это плагиат; когда человек берет, ну, скажем, из пяти источников, это уже терпимо, это компиляция, а вот если из шести и более - это уже прекрасно, это - эрудиция! (реплика студенту шестого курса А. Муратову).
Александр Владимирович Гальперин
представляет из себя скоростной спуск контента из блогов, для дальнейшего массового импорта в различные CMS. Он не требует настройки шаблонов или т.п. Нужно просто указать тему статей для поиска и начать парсинг. В настоящий момент он полностью бесплатный. . Из нововведений-синонимизация (теперь парсер может сам синонимизировать тексты Есть быстрый вариант с котроткой базой и более медленный. Если что, базы можно исправить. Файлы syn_s и syn_b). Так же исправил баг с пустыми ответами от яндекса.
Возможности программы можно просмотреть инбоксе
Список функций:
- Парсинге по заданному слову или выражения. Теперь результаты можно сортировать по дате публикации или по релевантности. При этом во время сортировки по дате результаты более содержательные.
- Парсинг статей заданной категории. При этом отбираются только статьи указанной категории или метки.
- Экспорт в отдельные html файлы, rss ленту или html файл для последующего импорта в zebroid или WPT, либо в свой формат из шаблона.
- Теперь можно парситы блоги, блоги целиком (статьи и комментарии из блогов), записи из блогов, записи с микроблогов, комментарии из блогов и микроблогов, форумы, все блоги и форумы.
- Можно обирать определенный сервис (livejournal т.п.) или даже отдельный блог.
- Функция замены слов в тексте. (Файл replace.txt в папке парсер Для замены слова «пользователь» на «читатель» добавьте туда строку «пользователь = читатель», без кавычек)
- Рядом с каждой функцией есть вопрос, при нажатии на который вы получите краткую справку.
- Удаление повторов. Парсер автоматически удаляет 90% повторных статей в случае если одна статья размещена на нескольких сервисах.
- Добавлении стоп слова. (Файл stop_slova.txt в папке парсера Писать надо по одному слову в строке. Если одно из этих слов встречается в тексте статьи то статья не сохраняется. Регистр значения не имеет.)
- Можно парситы собрание списка url статей, или запросов.
- Можно установить лимит постов или количества символов в тексте.
- Предварительный просмотр постов позволяет вручную отбирать нужные записи.
- Автоматическая синонимизация текстов внутри парсера.











Написал crazyyy
Категории: новости, софт