Назад... К оглавлению раздела Далее...
Описание формата файлов Pre-HTML.
I. Назначение формата.
Формат файлов Pre-HTML служит для полуавтоматического преобразования текстовых файлов и файлов программы ЛЕКСИКОН для MS-DOS в формат файлов HTML. Преобразование проводится средствами текстового редактора Multi-Edit, с целью их дальнейшего редактирования в HTML-редакторах.
II. Преимущества данного формата.
Преимущества данного формата следующие:
- содержание HTML-страницы можно набирать в текстовом редакторе, редактировать как текстовый файл, проверять орфографию и подвергать стилистическую проверку текста, не беспокоясь о расстановке HTML-разметки;
Примечание: проверка орфографии в текстовом режиме для текстов формата text/html, как автор убедился на своем опыте, невозможна;
- в формат Pre-HTML можно в полуавтоматическом режиме переводить файлы из формата ЛЕКСИКОН для MS-DOS;
- формат Pre-HTML прост в описании, и его можно легко создать с нуля или написать конвертер текстовых файлов различных редакторов в этот формат (и конверсию из этого формата).
III. Описание формата Pre-HTML.
- в файле формата Pre-HTML допускается использовать все символы формата text/plain. Следует быть осторожным при использовании зарезервированных символов;
- кодировка символов в данном формате должна соответствовать кодировке ASCII 8 (ANSI, OEM или KOI-8). Кодировки типа Unicode, UTF-7, UTF-8, UTF-16 и др. недопустимы;
- в качестве специальных зарезервированных символов в этом формате Pre-HTML используются следующие символы: ", <, >, &, N;
- вместо зарезервированных символов в тексте следует использовать:
- вместо & – сочетание & ;
- вместо " – сочетание " ;
- вместо < – сочетание < ;
- вместо > – сочетание > ;
- вместо № – N ;
- текст в формате Pre-HTML состоит из абзацев;
- каждый абзац состоит из символов алфавита text/plain, специальных зарезервированных символов, записанных в одной строке. Каждый абзац кончается знаками "возврат каретки/перенос строки";
- пустые строки между абзацами допустимы, но нежелательны (версия Pre-HTML 0.1.1.);;
- пробелы и знаки табуляции перед текстом недопустимы (версия Pre-HTML 0.1.1.);
- формат не делает различия между текстом абзаца, примечанием и заголовком (версия Pre-HTML 0.1.1.);
- списки в тексте оформляются как абзацы. Ненумерованный список начинается со знака "* ", отделенный от других символов знаком "Пробел", а нумерованный список, например – "1. " (то есть арабские цифры, точка и пробел);
- в тексте, дополнительно к допустимым символам текста и заменителей специальных символов, допустимо использовать следующие специальные конструкции:
- <B> ... </B> – текст внутри этих символов имеет полужирное начертание;
- <I> ... </I> – текст внутри этих символов отображается курсивом;
- <B><I> ... </I></B> – текст внутри этих символов отображаются полужирным курсивом;
- <U> ... </U> – текст внутри этих символов имеет подчеркивание;
- <U>HREF=ССЫЛКА#!ТЕКСТ_ССЫЛКИ</U> или
- <U>NAM=ССЫЛКА#!ТЕКСТ_ССЫЛКИ</U> - таким образом, в тексте помечаются гиперссылки. Здесь символы ССЫЛКА заменяются адресом гиперссылки, а символы ТЕКСТ_ССЫЛКИ заменяется текстом, показываемый при отображении гиперссылки;
- в качестве других специальных конструкций разрешается использовать конструкции языка гипертекстовой разметки HTML. Из его конструкций нежелательно использовать конструкции <P> ... </P>, <H1> ... </H1>, <LI> ... </LI> и т.п.
IV. Расширение файлов в формате Pre-HTML.
Стандартное разрешение файлов в формате Pre-HTML – rtx (Russian TeXt) или etx (English TeXt).
V. Создание текстового файла в формате Pre-HTML.
Создание файла в формате Pre-HTML осуществляется:
- с помощью программного файла txr2rtx – из файлов в формате ЛЕКСИКОН для MS-DOS;
- с помощью макросов программы Multi Edit версий 7.0 (для MS-DOS) и 8.0 (для Microsoft Windows) – для любых текстовых файлов.
Описание программы txr2rtx.exe смотри здесь.
VI. Редактирование файлов в формате Pre-HTML.
Редактирование файлов в формате Pre-HTML осуществляется:
- с помощью любого текстового редактора – вносятся изменения в содержание файла, и осуществляется расстановка специальных знаков;
- с помощью макроса Multi Edit hyper.mac – конверсия ссылок в формат HTML;
- с помощью макросов Multi Edit (brgen, pargen и т.п.) – осуществляется преобразование из файлов Pre-HTML в формат HTML;
- с помощью программ Orfo Speller (ЗАО "Информатик"), Microsoft Word, G4 и др. осуществляется проверка орфографии, грамматики и стиля, не прибегая к конверсии файла.
VII. Заключение.
Исходя из всего вышесказанного, можно отметить, что промежуточный формат файлов Pre-HTML представляется весьма удобным средством для предварительной обработки длинных текстов HTML-файлов, содержащих в основном текстовые данные. С этой позицией введение этого промежуточного формата для подготовки HTML-страниц кажется вполне нормальным и своевременным шагом.
Данный язык должен использоваться для подготовки контента HTML-страниц, содержащее большое число текстовых данных. Для разработки же гипертекстовых страниц, содержащих в основном разметку (такие как шаблоны, сайты с внушительной графической составляющей, HTML-формы и т.д.) лучше использовать традиционные технологии. Использование этой технологии для файлов, содержащих большой текстовый контент, дает значительный выигрыш во времени в подготовке готовых документов.
Назад... К оглавлению раздела Далее...