Продажи шаблона Google-Translate (Гугл Переводчик), скорость: 20 млн ключей/час, с прокси, без API

Тема в разделе "Услуги / Реклама / Барахолка", создана пользователем orka13, 31 май 2019.

  1. orka13

    orka13 New Member

    [​IMG]
    Внимание: Начиная с версии 2.00 шаблон переводит как обычные текстовые файлы, так и HTML-страницы с сохранением верстки. Это отрывает ему возможности полноценного перевода файлов дорвеев и прочих авто-генерированных сайтов.

    Последние версии шаблон делались в ProjectMaker 5.24.0.0. Стоит ограничение по запуску минимум 5.10.0.0, но как поведет себя на старых версиях ZennoPoster (старше 5.24.0.0) – хз, в любом случае у вас есть возможность обновить ZennoPoster.
    • Закрытого типа (только выполнение).
    • Из внешних подключений добавлены ссылка из GAC (System.Web) и HtmlAgilityPack.dll для полноценной работы C#-кубиков.
    • Нет лимита по размеру передаваемого текста (поток шаблона сам разобьет на куски текстовку, если увидит что не помещается в 1 запрос)
    • Все нюансы работы шаба описаны на вкладках «Входные настройки». Обязательно хотя бы первую прочтите.
    1. Эксперимент проводился при запуске с RAM-диска (хоть это и не обязательно), в режиме «#1.1 А)». Файлы были разбиты на мелкие части по ~5 мб, суммарный размер 800 мб (в кодировке “UTF-8 BOM”). Прокси тогда не понадобились, но с 2019 года шаблон использует прокси под нагрузкой.
    Нагрузка на CPU ~ 70% (запросы шлются без пауз, обработка сложного HTML-кода, пока не нашел как понизить), сеть ~ 20 Мегабит\секунду, RAM ~100 Мегабайт.
    На выходе получили 1,4 Гб переведенных фраз (русский текст больше места занимает). Если обратно переводить, то будет в 2-3 раза медленнее, из-за того, что в формате UrlEncode русский текст тоже больше места занимает.
    2. Постоянно спрашивают о скорости перевода статей. 25.05.2018 одному покупателю тестировал его пак:
    1100 HTML-файлов, но там именно разметка уже самой статьи под импорт в движок сайта (с тегами, списками, но без футера, менюшек). Размер 20 мб суммарный, 11,1 млн. символов самой текстовки (без кода тегов, это ~10К символов на 1 статью). Направление перевода [ru-pl]. Тестировали именно в 1 поток. Время, затраченное на перевод: 5 часов. Понятно, что на 20-30 потоках времени уйдет минимум в 10 раз меньше.

    Запускать шаблон теоретически лучше не больше чем в ~50-300 потоков, или так чтобы нагрузка на ваш CPU не превышала 80%. У меня практика показала, что даже если и добавить больше потоков, то скорость обработки не увеличится. Хотя все зависит от режимов работы и мощности железа. Колебание скорости реальной работы очень легко анализировать по графику нагрузки сети (у меня в районе 20 мбит\секунду идет передача). Если вы видите, что после прибавления потоков график уже не растет, значит не смысла ставить больше, ибо достигнут физический предел.
    Вот для понимания скриншот «Диспетчера задач» на Wondows 10, где по графику видно что нагрузка сети стабилизировалась на уровне ~10 мбит и не растет.
    «RAM-диск» - это технология, позволяющая использовать часть системной оперативной памяти как дополнительное дисковое устройство, то есть «сверхбыстрый» мини-диск.
    Сделать такое можно программой «SoftPerfect RAM Disk 3.4.8 Free». Уже есть версия 4, но она платная, можете искать ломанную на варез-трекерах; 3.4.5 версия идет в комплекте с Total Commander PowerUser (тот черный командер, который на моих видео). Из гугла по ней: обзор1, обзор2, видео. Отдельно стоит заметить, что в случае перезагрузки ПК - данные с рамдиска стираются, если дополнительно не настроить резервное копирование на жесткий диск в софте.


    [​IMG]
    [​IMG]

    [​IMG]

    [​IMG]

    [​IMG]

    [​IMG]

    [​IMG]

    [​IMG]

    Потому что он лучше всех понимает нелитературный язык (сленг). Сравнивал несколько лет назад на ключах своей тематики, и только гуглу удавалось нормально перевести смысл спорных фраз.

    • В своих шаблонах в качестве подшаблона.
    • В генерации текстовки дорвеев, сателлитов и т.д.

    Кто покупает шаблоны ZennoPoster, тот в курсе стандартных условий, которых придерживается большинство продавцов. Но все же продублирую для новичков:
    Шаблон закрытого типа, а значит будет только запускаться в ZennoPoster или ZennoBox, но не в ProjectMaker. Привязка идет на одну почту-лицензию зенки без возможности пере-привязки. То есть вы можете и на нескольких ZennoPoster запускать на разных ПК одновременно шаблон. Но только при условии, что все они куплены на один и тот же профиль (почту-лицензию) в кабинете userarea.zennolab.com.
    Если у вас нет ZennoPoster, то придется выписывать шаблон для ZennoBox, и тут мне нужна стандартная доплата +10$ для погашения комиссии сервиса по формированию ZennoBox-версии.



    Видео. Оно в посте №26 описано. Правда оно тоже старело, так как снято еще 27.12.2017 на версии шаблона 2.03, но основные моменты работы в нем раскрыты, а актуальные возможности и настройки ищите в спойлере "Spoiler: #5. Скриншоты «Входные настройки» с кучей настроек:", там постоянно обновляю картинки под каждую новую версию.




    Видео для версии 2.0:


    Самое первое видео для версии 1.0:

    Если у вас нет программы ZennoPoster для запуска данного шаблона, то можно легко (+10$ к цене) прикупить ZennoBox-версию (что такое ZennoBox), которая даст возможность запускать данный шаблон в 20 потоков, чего обычно хватает с головой. Только не забудьте указать при покупке что нужна именно ZennoBox-версия.


    Продажи возможны вручную через ЛС/Skype/Telegram. Очень желательно проводить оплату через WebMoney. Так как через другие платежные системы (ЯндексДеньги или QIWI) я добавляю +5% к ценнику.
    Статус картинка с последней информацией, ценой и контактами моими (если картинки нет, то попробуйте в другом браузере открыть без блокировки рекламы):
    [​IMG]
     
  2. orka13

    orka13 New Member

    Сделал простенький шаблон в режиме «Проект в Проекте», где он берет входящие данные построчно из текстовой таблицы (CSV / TXT, не путать с «Microsoft Office Excel») и переводит моим шаблоном переводчика. Такими данными могут быть Мультикей-строки для доргена или другого комбайна. Покупатели часто спрашивают, как подобное провернуть, вот и решил поделится наработкой. Найти этот шаблон покупатели могут среди вспомогательных файлов на ЯндексДиске.
    Разделитель ячеек в строке задайте сами внутри шаблона. Шаблон переводит фактически отдельно каждую строку (разбивая ячейки в ней на новые строки, чтобы тоже как-бы отдельно независимо переводить), и потом обратно все в таблицу склеивает. Если работать в 1 поток, то структура таблицы не изменится. При многопотоке могут строки между собой поменяться позициями, но это в большинстве задач не критично.
    Входящий файл в кодировке UTF-8 подсунуть шаблону в виде файла [G_Google_Translate_CSV_MKey\Input\Keys.txt]. Если файл ключей имеет размер > 10 Мегабайт, то желательно разделить его на части и закинуть в папку [G_Google_Translate_CSV_MKey\Input\part\]. Подробная инструкция разделения уже описывалась в шаблоне переводчика в пункте настроек #6.2.
    Получается, что если в файле Keys.txt строки типа:
    Код:
    Hello man;Who is on duty today ; My name is Tom
    I am superman;Give me all your money! Or Die!;This is the bus stop
    То на выходе в файле [G_Google_Translate_CSV_MKey\Output\CSV_Translated_31_05_2019.txt] будет:
    Код:
    Привет чувак;Кто сегодня дежурный; Меня зовут Том
    Я супермен;Дай мне все свои деньги! Или умри!;Это автобусная остановка
    P.S. Дотошный глаз заметит, что там пробелы лишние пропали. Увы, это не опечатка, это Гугл так при переводе пробелы любит убирать\добавлять на свое усмотрение, об этом я писал уже в настройках шаблона.