Наборы Символов (Кодовая Страница)/Character Sets

Amaya читает документы HTML и XHTML по-разному:

Amaya читает документы HTML по умолчанию как имеющие кодировку ISO-Latin-1. Если автор не предоставляет информации о кодировке (charset) в шапке HTTP или в элементе META, Amaya рассматривает документ HTML как кодированный в ISO-Latin-1.

Amaya читает документы XHTML по умолчанию как файлы в кодировке UTF-8. Если автор не предоставляет информации о кодировке (charset) в шапке HTTP, в объявлении XML или в элементе META, Amaya считает XHTML-документ кодированным в кодировке UTF-8.

Поскольку кодировки по умолчанию для HTML и XHTML-документов отличаются, авторы часто создают документы в некорректной кодировке. Например, XHTML-документ использует ISO-Latin-1, но не предоставляет информации о наборе символов/charset. Когда XML-разборщик анализирует документ и обнаруживает символ, не соответствующий правильному символу из UTF-8, документ считается неправильно сформированным. Разбор останавливается, и Amaya выводит сообщение об ошибке, в котором предлагается перезагрузить документ как HTML-документ либо вывести сообщение об ошибках. Если выбрано сообщение об ошибках, Amaya активирует опцию Reparse in HTML из меню File. Выберите эту опцию для установки набора символов документа ISO-Latin-1 и открытия этого документа так, будто он правильно разобран. Amaya считает повторно открытый документ изменённым (поскольку добавлена новая кодировка), и вы можете сохранить его.

Содержание раздела