ContentBox 5.0

Тема в разделе "Апдейты Софта / Software Updates", создана пользователем TopperHarley, 2 ноя 2019.

Метки:
  1. TopperHarley

    TopperHarley Administrator Команда форума

    Ап ContentBox 5.0
    • Добавлен язык Иврит, Тайский
    • Добавлена экспериментальная поддержка Японского и Корейского языков
    • Добавлена опция перепаршивания текста/сниппетов при пустой выдаче в парсерах
    • Доработки в движке парсинга статей с разметкой
    • Если отфильтрованы все ключи, то найти их можно в файлах *_filtered_error.txt
    • Поправки для Французского языка в Бинге
    • Доработки работы с SQLite, поправлено склеивание, выборка и так далее
    • Добавлена возможность отключить скачивание доноров под юзерагентом Googlebot, например из-за абуз
    • Прочие багофиксы, оптимизация
    Скачать http://pandoraboxx.ru/update/cb/ContentBox50.zip

    На всякий случай : Предыдущая версия

    Для отключения в файл тюнинга добавляем строку
    Код:
    UserAgent=Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; rv:11.0) like Gecko
     
    Последнее редактирование: 2 ноя 2019
    user105164, user5866, xtezy и 4 другим нравится это.
  2. user586717

    user586717 New Member

    Пожалуйста подробнее.
    (сколько раз пытается перепарсить, что произойдет если я паршу с семейной настройкой и выдача по ключу не просто так пустая, что меняется при следующей попытке спарсить и т.д.)
     
  3. TopperHarley

    TopperHarley Administrator Команда форума

    Опция перепаршивания пустой выдачи давно была у всех парсеров текста, теперь добавляется возмодность ее выключить, так пожелал один из пользвателей.
    Перепарсить пытается на втором заходе парсинга, пытается сделать 1 успешную попытку и много неуспешных, если плохая прокся.
    Если настройки поиска дают пустую выдачу по любой причине(семейный в том числе), то выдача пустая. С этой опцией будет перепарсинг, если выключить, то не будет