Один раз совершенно случайно мне пришлось открыть файл с расширением .txt в Microsoft Word. Файл открылся, однако набранный в нем текст выглядел довольно странно. Как будто кто-то специально расставил лишние пробелы и абзацы. Не совсем понимая, в чем дело, я открыл этот же документ в Notepad’е. Ни единого лишнего абзаца там не наблюдалось. Так я впервые столкнулся с проблемой конвертирования DOS’овского текста.
На первый взгляд, описанную проблему решить несложно, ведь лишние пробелы и абзацы можно удалить вручную. Однако мне этого делать совсем не хотелось, ведь документ был достаточно большой друг попросил распечатать скачанную из Интернета книжку. Долгие часы, проведенные в поисках какой-либо настройки MS Word, которая могла бы убрать эту проблему, ни к чему не привели. Не имея возможности получить от кого-нибудь дельный совет, я обратился за помощью в Интернет. Выход из затруднительного положения был найден в Сети оказалось достаточно софта, способного решить данную проблему.
Text Editor запросто отформатирует текст, убирая подряд идущие пробелы и знаки препинания, изменит кодировку и пр. Интерфейс программы состоит из четырех закладок.
В первой из них File выбирается файл, а также запускается процесс конвертирования. На закладке Options размещены основные настройки (Рис. 1). Здесь нужно указать кодировку исходного файла и того, который должен получиться. Если вы используете Text Editor для работы с MS Word, эту настройку менять не нужно по умолчанию стоит кодировка Windows. Поставив галочку напротив Formatting Text, можно задать форматирование абзацев отступ «красной строки», правое и левое поля. Группа настроек Save Option позволяет сохранять полученные файлы в форматах .tеx, .doc или .uni. Также можно заменить старый текст или создать файл отката. Если вы выберете создание нового файла, программа сохранит его в той же директории, откуда запускается исходный, так что вам не придется долго его искать. В закладке Additional помещены некоторые дополнительные опции удаление знаков переноса и пустых строк, упорядочивание знаков препинания. Последняя закладка Replace служит для автоматической замены например, программа умеет заменять все управляющие символы пробелами, символ табуляции на пять пробелов и т.д.
Большинство программ для конвертирования .txt в .doc работают не самостоятельно, а как встраиваемые надстройки макросы. Одно из самых простых подобных расширений описываемая здесь утилита. С ее помощью можно конвертировать тексты, написанные в устаревших текстовых редакторах или полученных в результате сканирования.
Для того чтобы программа начала работать с вашим Word, перепишите файл Формат-Киллер 1.0.dot в папку Startup она находится в директории MS Office. Программа добавит в меню Формат свою строчку.
Для конвертирования текстовых файлов используется команда Конвертор формата. Перед обращением к ней нужно выделить нужный участок текста. В появившемся окне с настройками задаются основные опции (Рис. 2). Коротко их перечислю:
Автоотступ пробелы, автоматически добавляемые текстовым редактором вначале каждой строки для увеличения отступа от левого края листа. Это необходимо при печати для выравнивания текста посередине страницы. Если в исходном тексте автоотступ присутствует, нужно отметить галочкой опцию «Автоотступ» и указать количество пробелов в нем.
Отступ абзаца отступ первой строки в абзаце («красная строка»). Этот вид отступа может быть в виде символа табуляции или в виде нескольких пробелов. В первом случае отметьте галочкой «Символ табуляции», во втором выберите количество пробелов. В некоторых случаях этот вид отступа не применяется, тогда разделителем абзаца будет считаться пустая строка (два последовательных символа абзаца). В данном случае количество пробелов нужно установить в ноль.
Наличие переносов если в исходном тексте имеются переносы, необходимо установить переключатель в положение «Есть переносы» (используется по умолчанию), если они отсутствуют, можно использовать любой режим, но при отключении переносов программа будет работать быстрее.
Пробелы в некоторых текстовых редакторах для выравнивания текста по ширине страницы между словами автоматически вставляются лишние пробелы. Для их удаления установите максимальное количество пробелов между словами.
Вторая команда программы Конвертор DOS в Windows служит для преобразования текстов, напечатанных в устаревших редакторах типа Word & Deed, «Лексикон», встроенного редактора Norton Commander и т.п. Таблица символов кириллицы в MS DOS и MS Windows (ASCII) не совпадает, поэтому текст из DOS будет невозможно прочитать без конвертирования. «Формат-Киллер» поможет также удалить нетекстовые символы, которые используются для форматирования текста в старых редакторах. MS Word обычно печатает на их месте пустые прямоугольники.
Среди недостатков «Формат-Киллер» было замечено то, что программа не распознает корректно переносы, если символ переноса задан дефисом. Также с помощью программы не удастся обработать большие участки текста «Формат-Киллер» может зависнуть. Поэтому текст лучше делить на участки и обрабатывать максимум страниц по пять-десять.
Пакет макрокоманд «Верстка текста книжкой 5.11» включает в себя несколько макросов, призванных облегчить работу в Microsoft Word. Среди них есть и программа для конвертирования текста Dos в формат .doc.
Для установки программы требуется запустить документ Установка.doc, разрешить запуск макросов (Сервис > Макрос > Безопасность) и нажать на кнопку Установить в появившемся диалоговом окне.
После этого программа будет установлена и добавит свою панель инструментов. Одна из кнопок называется Convert Dos Text. После ее нажатия вылетит большое окно с настройками (Рис. 3). Программа оптимизирует количество и расположение пробелов в тексте (заменит там, где надо, их табуляцией и центрированием), удалит ненужные символы концов абзаца и лишние знаки переноса слов. Настроек у программы довольно-таки много, так что для каждого текста можно подобрать оптимальные параметры форматирования. Среди недостатков макроса можно отметить то, что он «не умеет» удалять пустые строки.
Как и прошлая программа, WordUtilities 2002 это пакет макрокоманд. Он состоит из пяти панелей инструментов, на которые вынесены команды, которые нужны пользователям чаще всего. WordUtilities 2002 также располагает некоторыми инструментами, которых нет в Microsoft Word. Один из них красноречиво зовется Перелопачивание текста. Эта команда находится в меню WU, которое программа добавляет в офисный пакет (Рис. 4).
С помощью «Перелопачивания текста» можно исправить ошибки OCR, удалить повторяющиеся пробелы, пробелы в начале абзаца, пустые абзацы и т.д. Стоит заметить, что данная команда служит не только для конвертирования файлов .txt, но и для исправления ошибок набора или некачественного импортирования текстов. Многие пользователи при подготовке текста забывают об основных правилах набора. Например, ставят пробел не после точки или другого знака препинания, а перед; ставят пробел перед закрывающей скобкой, а не после открывающей. Таких недочетов в наборе текста может быть очень много, и все это приходится исправлять вручную. Команда «Перелопачивание текста» позволяет автоматизировать этот процесс. Что касается конвертирования DOS-файлов, то для корректной работы необходимо в настройках программы дополнительно поставить флажок напротив параметра Удалять конечные абзацы (импорт DOS-файлов). Небольшой недостаток программы, который был замечен мной во время тестирования после «перелопачивания» некоторые слова «потеряли» первую и последнюю букву.
Из достоинств WordUtilities 2002 можно отметить установку программы. В отличие от других макросов, этот пакет имеет Мастер установки, так что с инсталляцией проблем не будет.
Безусловно, существуют и другие варианты конвертирования DOS’овского текста, о которых я не рассказал в этой статье. Если кто-то знает более удобные способы решения этой проблемы, буду рад, если вы напишите мне о них.