Уверен, что практически каждый из вас неоднократно получал письма по электронной почте и хоть одно из них выглядело подобным образом: «ОПНИДЕР ОПЕЯЯ-ЙНМТЕПЕМЖХЪ, ОНЯБЪЫЕММЮЪ БШУНДС Б ЯБЕР ОНДЦНРНБКЕММНИ IREX ЙМХЦХ "пНЯЯХИЯЙХИ хМРЕПМЕР: МЮЙЮМСМЕ АНКЭЬХУ ОЕПЕЛЕМ".Данная шифровка означает лишь то, что письмо пришло в кодировке отличной от той в которой по умолчанию работает ваш почтовый клиент. Если штатными средствами программы не удается перевести текст в нужную кодировку, напрашивается вывод: необходимо использовать дополнительное программное обеспечение. Программой, которая без труда работает с огромным количеством кодировок, является замечательный продукт под названием Штирлиц. Именно о ней и пойдет дальнейший разговор.
{mosloadposition debug}
«Штирлиц» расшифровывает русские тексты в кодировках Win-1251, KOI-8r, DOS, ISO-8859-5, MAC и др., латинской транслитерации, форматах Quoted Printable, HTML и Unicode, закодированные (uuencode, xxencode, base64, binhex (Hqx7)) тексты и файлы, а также тексты со смешанным перекодированием, и имеющие фрагменты в различных кодировках.
Данный продукт приводит эти тексты к кодировке Windows (1251) для прочтения и дальнейшей работы с ними. С помощью «Штирлица», данные тексты можно рассматривать в любой кодировке, а также преобразовывать в любую кодировку (win, koi, dos, iso, mac, lat и др.). Также есть возможность настраивать и использовать различные схемы транслитерации и кодировки.
Сам механизм распознавание может запускаться в автоматическом режиме, если вставлять текст из буфера обмена, а также при загрузке файла и сохранять текст в любых из перечисленных кодировок. «Штирлиц» даже имеет возможность слежения изменения буфера обмена и приведение этого содержимого к кодировке Win.
Теперь подробнее самой установке.
Предлагаю скачать программу Штирлиц с нашего сайта. Сделать это можно здесь.
По окончании скачивания распаковываем файлы и запускаем файл Shtirlitz.exe.
В каталоге с программой также содержатся следующие файлы:
Shtirlitz.exe - программа "Штирлиц", версия 3.0,
Shtirlitz.hlp - Help-файл,
Shtirlitz.cnt - содержание Help-файла,
Shtirlitz.lat - файл с описанием схем транслитерации,
Shtirlitz.ncd - файл с описанием кодировок,
Shtirlitz.vcb - файл со словарем,
uninstall.txt - руководство по деинсталляции.
И еще пару файлов с примерами
Для удобства последующей работы можно создать на рабочем столе ярлык программы.
Теперь поговорим об использовании «Штирлица».
Первым способом можем скопировать нечитаемый текст в буфер обмена (выделив его, нажав правой кнопкой мыши и выбрав «Копировать» или же CTRL+C), вставить в окно программы и нажать «Decode».
Вторым способом можно задать в программе расширения файлов, к которым будут использоваться возможности «Штирлица». Для этого открываем программу «Проводник» и щелкаем правой кнопкой мыши по нужному файлу. Появится контекстное меню, где выбираем «Открыть Штирлицем» и в открывшемся окне нажимаем Decode.
!!! Если вам нужно переместить «Штирлиц» в другой каталог (в нашем случае это C:\Program Files\SHTIRLITZ), то, при первом запуске из вашего нового каталога, программа произведет перерегистрацию в реестре (автоматически).
Настройка «Штирлиц»
Давайте вкратце расмотрим элементы управления программой. В частности главное меню. Выясним: какие задачи у отдельно взятых пунктов.
Автораспознавание (Autodetect) – программа автоматически будет проводить раскодировку текста сразу же после вставки из буфера обмена или после того как будет загружен из файла. Если же в этом пункте флажок не установлен, то загруженный текст будет показан в исходной кодировке (текущая кодировка показана утопленной кнопкой слева на панели статуса).
По фрагментам (Search fragments) – при установленном флажке «Штирлиц» будет выделять фрагменты текста, которые имеют разную кодировку. Будет произведен поиск фрагментов, которые содержат более двух букв каждый. Если же нужно распознать фрагменты менее двух букв, то требуется вручную их выделить и нажать Decode. Поиск немного замедляет работу «Штирлиц» и игнорируется флажок Ограниченная длина (Limited Length). При проведении экспресс-распознавания, фрагменты писаться не будут и не флажок не отобразится.
Ограниченная длина (Limited Length) – «Штирлиц» будет проверять кодировку по первым словам текста (условно делая вывод, что и остальной текст написан в той же кодировке). Эта функция значительно ускорит работу «Штирлица» и если ее убрать, то будет проверяться весь текст. Как описывалось выше при установленном По фрагментам (Search fragments), этот пункт игнорируется автоматически.
Максимальная глубина вложений (Max. Depth) – тут устанавливается максимальное число вложений. Если текст, к примеру, взят из электронной почты, тогда будет достаточно глубины 2-4. Однако когда программа найдет подходящее преобразование, то сама прервет процесс распознавания (можно самим прервать данный процесс).
Строгость (Strictness) – Данная функция устанавливает некоторые качественные параметры (в текстах нередко встречаются опечатки и сокращения), но с другой стороны включает режим экспресс распознавания, который хоть и работает быстрее, но имеет также и свои особенности. Оптимальное положение этого пункта будет «посередине». Чем выше будет стоять строгость – тем больше комбинаций кодировок до заданной глубины «Штирлиц» будет вынужден просматривать.
Схемы - Неполные, Полные, Странные (Partial, Full, Strain schemes) – подключает для автораспознавания различные наборы схем. Неполные переводят лишь символы, которые соответствуют русским буквам. Полные переводят символы, определенные в начальной и конечной кодовой странице. Странные схемы, это схемы которые используются некоторыми программами перекодирования. Естественно никто не может знать, в каком месте текст подвергается какому преобразованию, поэтому советую проверять все. Конечно, процесс преобразования замедлится, но зато он будет вернее. !!! Хотя бы одна схема должна остаться отмеченной так как «Штирлиц» не может оставаться без схем и прежде чем снять одну, нужно отметить другую!!!
Режим экспресс распознает, когда установлен в крайнем левом положении регулятора строгости определения. Результат достигается быстрее обычного режима, но:
1.Текст не проверяется на фрагменты с разными кодировками;
2.Ограничивается длина проверяемого текста
3.Нельзя просмотреть лучшую из проверяемых кодировок
4.В случае неудачи программа не показывает версий относительно последовательных кодировок, где хоть что-то можно понять в тексте.
Если данная функция не будет срабатывать – просто ставим регулятор посередине и снова жмем Decode.
Есть еще вариант, что будет недостаточна глубина вложений и тогда просто делаем тоже самое, но уже с увеличенной глубиной вложений.
Когда завершается работа «Штирлиц», все установки сохраняются.
Меню «Штирлиц».
Его можно открыть либо нажатием мышки, либо клавишей F10.
Вставить (Paste), Скопировать (Copy) – думаю что здесь и так все ясно абсолютно всем. Есть лишь пару нюансов:
Вставляя текст (Paste), новый текст полностью заменит предыдущий;
Если установлен флажок «открытие в новом окне» или нажата CTRL, то содержимое буфера появится в новом окне.
Закрыть окно (Close window) – закроет окно редактора и если оно будет одно, то очистит его.
Загрузить (Load), Сохранить (Save), Печатать (Print) – понятно.
Сохранить файл (Save file) – появляется, когда произведется раскодирование файлов в формате uu-encode, xx-encode, base64, binhex.
Раскодировать (Decode), Отменить (Undo) – «Раскодировать» находит кодировку выделенных фрагментов и перекодирует их в Win-1251. Если ничего не выделено, то преобразуется весь текст.
«Отменить» - восстанавливает текст до последней операции.
Html->Text – выполняет преобразование Html-файла в текстовый.
Очистить список (Clear enc. list) – очищает список последних выполненных 10 преобразований, при которых «Штирлиц» расшифровал текст. Каждый раз, когда программа раскодирует текст, перед проверкой двойных преобразований, проверяет последние 10 удачных, что сокращает время операции по расшифровке текстов, которые имеют одну кодировку. Иногда предшествующее преобразование почти правильно расшифровывает текст и выдает его как готовый результат. Чтобы такого не случалось данная функция помогает этого избежать.
Найти (Find), Найти дальше (Find next), Заменить (Replace – поиск по образцу и замена фрагментов.
Параметры (Options), Статус (Status bar) – показывает или прячет панель параметров и статуса в нижней части экрана.
Переносить слова (Word wrap) – включает либо выключает мягкий перенос слов на новую строку, если она превышает ширину окна.
Наконец, в заключение нашего небольшого обзора, хотелось бы расказать про некоторые "горячие" клавиши, использование которых позволит ускорить значительную часть операций при работе с программой:
Горячие клавиши:
Alt-P - Вставка текста из буфера с распознаванием кодировки
Alt-C - Копирование текста в буфер в текущей кодировке
Alt-L - Загрузка файла с распознаванием кодировки
Alt-S - Сохранение файла в текущей кодировке
Alt-D - Распознавание кодировки выделенной части текста
Alt-U - Отмена последнего преобразования
Alt-N - Распечатка текста на принтере
Специально для проекта Ячайник, Захар Шушкевич
{mosloadposition cpanel}