Какие форматы текстовых файлов бывают и в каких программах можно открывать
Читайте, что это за форматы текстовых файлов: TXT, RTF, DOC, DOCX, HTML, PDF. Какие программы поддерживают и как можно редактировать, открывать и сохранять. Далее поговорим о них подробнее. Во время работы с документами можно далеко не сразу обратить внимание на доступное им разнообразие форматов. Далее мы подробнее остановимся на особенностях каждого из них.
Самый распространенный и простой формат текстовых файлов — TXT
Если говорить о том, какой формат текстовых файлов появился первым, это будет txt – его история началась практически одновременно с возникновением такого явления, как персональный компьютер. В файле имеется исключительно текст, форматирование, картинки и шрифты в txt не сохраняются. Данный формат можно считать одним из наиболее универсальных – его распознают сотни приложений для различных устройств.
Среди прочего, TXT можно открыть одним из следующих приложений:
Форматы файлов текстовых документов начали стремительно развиваться, и компания Microsoft разработала решение Rich Text Format — RTF. Перед нами кросс-платформенный формат, способный хранить текстовые сведения. RTF способен сохранять форматирование и вставлять в текст различные объекты:
Формат rtf работает с технологией «управляющих» слов, они выделяются специальными символами и поэтому документ занимает больше места на диске.
RTF можно открыть одним из следующих приложений:
Обсуждая распространенные форматы текстовых файлов следует отдельно сказать о doc. Данное решение также было создано корпорацией Microsoft, оно применялось редактором Word. Отметим, что файлы doc относятся к бинарным, их поддерживают практически все существующие сегодня текстовые редакторы. Данный формат поддерживает гиперссылки, вставку в текст картинок и прочих объектов, стили и форматирование.
Открыть DOC можно одним из следующих приложений:
Открыть DOCX можно одной из следующих программ:
Форматы, в основу которых положена технология HTML получили широкое распространение, среди них следует отметить MHT, CHM и HTM. Язык HTML создавался специально для разработки веб-страниц, однако его удобство, небольшой размер и универсальность привели к тому, что сейчас данное решение активно используется для хранения текстовой информации. Файл HTML легко воспроизвести базовыми инструментами ОС, он не требует установки стороннего программного обеспечения.
Компания Adobe создала данное решение для различных полиграфических целей. Файлы pdf оказались настолько удобными, что превратились в стандарт в сфере обмена документами.
Также PDF можно открыть одним из следующих приложений:
Данный формат используется в документах OpenOffice. Он является открытым и выступает альтернативой коммерческому решению docx. Также позволяет добавлять в текстовую информацию гиперссылки, таблицы, изображения.
Открыть ODT можно одним из следующих приложений:
Форматы текстовых файлов для электронных книг
Существует особые текстовые форматы, которые созданы специально для чтения на электронных книгах. Для работы с подобными материалами требуется особое устройство или программное обеспечение. Документы, сохранные в таких форматах не поддерживают редактирование.
К ним можно отнести:
Как поменять формат текстовых файлов
Чтобы сохранить текстовый файл в определенном формате легче всего использовать функции приложения Microsoft Word. Алгоритм действий следующий:
Далее, чтобы изменить формат текстового файла достаточно выбрать предпочтительный из выпадающего списка и указать место сохранения. Word способен самостоятельно определять текстовые форматы файлов, что позволяет легко преобразовывать документы.
Изменение txt
В случае с txt, проще внести перемены в расширение документа. Первое, что необходимо сделать, это включить показ расширений в операционной системе.
Последние символы, которые находится в названии файлов – обозначают его формат. Раньше формат определялся тремя символами, но со временем для него стали использоваться и более символов, например, 4 или 5.
. txt – первый формат для текстовых файлов, в котором не используется форматирование (размер шрифта, полужирный, отступ абзаца и пр,). Содержит только текст.
. rtf – формат для текстового редактора, имеющий возможность использоваться в разных операционных системах, то есть, можно переносить с компьютера, имеющего одну операционную систему на другой компьютер с другой операционной системой.
Информация данного сайта предназначена для бесплатного изучения персонального компьютера. Можно копировать, передавать материалы другим лицам.
Запрещается использовать материалы для получения личной финансовой выгоды, а также размещать на сайтах в интернете.
Подготавливая на компьютере текстовые документы, вы не могли не обратить внимание на большое количество форматов текстовых файлов. Давайте попробуем разобраться в этом изобилии форматов и посмотрим, для чего каждый из них предназначен.
Какие бывают текстовые форматы
Данный формат появился вместе с первым компьютером. В *.txt-файле содержится только текстовая информация и ничего больше – данные о форматировании, шрифтах, картинках там сохранить не получится. Формат является наиболее универсальным – он может открыться на всех устройствах с помощью любого приложения.
Расширенный текстовый формат (Rich Text Format) был разработан компанией Microsoft как универсальный кросс-платформенный формат для хранения текстовой информации. Сохраняет данные форматирования, позволяет производить вставку дополнительных объектов:
Основная «фишка» rtf-формата – использование специальных «управляющих» слов, выделенных спецсимволами, что приводит к значительному увеличению объема файла.
Формат *.doc также разработан корпорацией Microsoft и использовался в текстовом редакторе Word. Если быть точным, то doc-файлы на самом деле бинарные, их можно открыть в большинстве современных текстовых редакторов. Имеют возможности сохранения форматирования, стилевого оформления, вложения картинок и других объектов в текст, а также поддержку гиперссылок.
Усовершенствованный и лицензированный формат от Microsoft, появившийся впервые с пакетом Office 2007. Представляет собой следующий этап формата *.doc.
Достаточно популярны сейчас форматы, основанные на Hyper Text Markup Language (HTML) – HTM, CHM, MHT и др. Язык HTML был разработан специально для создания веб-страниц, но благодаря своей универсальности, удобству и небольшому размеру стал широко использоваться для хранения текстовых данных. Любой HTML-документ можно прочитать с помощью стандартных инструментов операционной системы, без использования сторонних программ.
Формат разработан компанией Adobe специально для нужд полиграфии. Впоследствии пользователи оценили удобство использования pdf-файлов, и этот формат стал стандартом для обмена документами.
Формат файлов для документов OpenOffice. Альтернатива закрытому формату docx от Microsoft. Поддерживает большую часть форматирования что и «DOCX», включая вставку изображений, таблиц и гиперссылок.
Форматы для электронных книг
Кроме вышеописанных, существует также много форматов текстовых файлов, разработанных специально для чтения в электронном виде. Такие файлы нельзя отредактировать, а для просмотра необходима специальная программа. К таким форматам можно отнести:
Вместо послесловия
Мы рассмотрели с вами основные типы форматов текстовых файлов. Конечно, со временем некоторые из них могут устареть, уступив место более современным, с расширенными возможностями. А встречались ли вам текстовые файлы, которые не удалось открыть на компьютере или мобильном гаджете?
Те́кстовый файл — компьютерный файл, содержащий текстовые данные, как правило, организованные в виде строк.
Текстовым файлам противопоставляются двоичные файлы, в которых содержатся данные, не рассчитанные на интерпретацию в качестве текста (например, файлы, хранящие закодированные звук или изображение).
В отличие от термина «текстовый формат», характеризующего содержимое данных, термин «текстовый файл» относится к файлу и характеризует его как контейнер, хранящий такие данные.
Содержание
Описание
Текстовый файл представляет из себя последовательность символов (в основном печатных знаков, принадлежащих тому или иному набору символов). Это символы обычно сгруппированы в строки (англ. lines, rows ). В современных системах строки разделяются разделителями строк, в прошлом же применялось хранение строк в виде записей постоянной или переменной длины (см.: Перфокарта). Иногда конец текстового файла (особенно если в файловой системе не хранится информация о размере файла) также отмечается одним или более специальными знаками, известными как маркеры конца файла.
Текстовой файл может содержать как форматированный, так и неформатированный текст.
Преимущества и недостатки
Форматы, основанные на текстовых файлах
В текстовом файле текст может храниться как в неформатированном, так и форматированном или размеченном виде (например, Rich Text Format, HTML), где к каждому символу может быть применено форматирование (шрифт, начертание, размер и т. п.).
Расширения имён файлов
В DOS и Windows для файлов с неформатированным текстом обычно используется расширение .txt. Тем не менее, текстовыми могут являться файлы с любым другим расширением или без оного. Например, исходные коды программ обычно хранятся в файлах с расширениями, соответствующими языку программирования, на котором написаны программы (.bas, .pas, .c).
Форматированный тест (текст с разметкой) обычно хранится в файлах с расширением, соответствующим формату или языку разметки — .rtf, .htm, .html.
Кодировки
8-битный текст
Исторически для кодирования текстовых файлов применялись 7-битный набор символов ASCII, а также 8-битные EBCDIC и различные расширения ASCII. В 8-битных кодовых страницах общепринято использовать в первой половине кодовой таблицы символы, соответствующие ASCII.
Преимуществом 8-битного представления текста является программная простота и независимость от проблемы порядка байтов или длины машинного слова на разных платформах. Недостаток — большое количество различных стандартов, что может приводить к несовместимости.
Unicode в текстовых файлах
Применение Unicode в текстовых файлах хотя в основном решает «проблему кодировок» и стандартизирует употребление управляющих символов, но создаёт свои проблемы. В большинстве современных систем неделимой единицей информации в потоке данных является байт (8 бит), которых для кодирования одного символа из Юникода требуется несколько. В качестве решения применяются несовместимые между собой системы UTF-8 и две версии UTF-16 (UTF-16LE и UTF-16BE с противоположным порядком байтов). Иногда в начало файла добавляют специальный символ-маркер (U+FEFF [1] ), позволяющий распознать формат однозначно. UTF-8 имеет преимущество обратной совместимости с ASCII, однако программная обработка текста в UTF-8 усложняется непостоянным размером символа. Также, тексты в Юникоде отличаются ещё большей избыточностью, нежели 8-битные.
Управляющие символы
Различные операционные системы придерживаются своего представления перевода строки и конца файла. В UNIX перевод строки состоит из одного символа LF (код 10), в Mac OS — из символа CR (код 13), а в DOS и Windows перевод строки кодируется последовательностью двух символов: CR и LF.
Помимо названных, в текстовых файлах применяются такие символы, как табуляция (код 9) и перевод страницы (код 12).
Это старейший текстовый формат, аналоги современного блокнота были еще на первых ПК. Является наиболее универсальным. Документы txtоткрываются текстовыми редакторами, работающими в любой операционной системе.
Формат очень простой и не содержит ничего, кроме текста. Форматирование не поддерживается — сохраняются только абзацы, отступ и заглавные буквы. Поэтому файлы-txt отличаются маленькими размерами. Формат устойчив к повреждениям. При повреждении части файла можно восстановить или обработать остальную часть документа.
Формат rtf
Специально разработан программистами компаний Microsoft и Adobe для обмена файлами между пользователями. Может быть открыт и обработан на любой платформе. Поддерживается многими приложениями. В настоящее время rtf введен в Windows в качестве Clipboard-формата, это дает возможность обмениваться данными между различными прикладными программами.
Документ-rtf поддерживает сложное форматирование. Помимо текста может содержать различные рисунки, таблицы, вставки и сноски. В нем могут использоваться несколько видов шрифтов. Формат устойчив к повреждению файлов. Так как в rtf не используются макросы, он считается более безопасным чем формат doc.
Формат doc
Было время, когда формат doc использовался для простых и не отформатированных текстовых документов, а Microsoft Word являлся обычным текстовым редактором. Однако в начале 90-х годов ситуация начала меняться. И приложение, и формат постоянно обновлялись. При этом каждая новая версия все больше отличалась от предыдущей.
Сегодня doc предоставляет огромные возможности по обработке текста и вставке в документ различных изображений, диаграмм, таблиц, ссылок. Может включать в себя сценарии и макросы. Но нужно помнить, что формат является закрытым, многие документы в этом формате корректно отображаются только в самой программе MS Word.
К тому же разработчики не озабочены и обратной совместимостью версий своего приложения. Файлы, созданные в новом MS Word, невозможно открыть в предыдущих версиях программы без установки плагинов. Главным же отличием формата doc от txtи rtf является бинарность, которая делает их нечитаемыми в простых текстовых редакторах.
Формат docx
Впервые был применен в MS Word 2007. Его главное отличие от формата doc — использование zip-компрессии для уменьшения объема файла. Представляет собой архив с данными, содержащий помимо текста в формате XML, изображения, стили текста, форматирование и другие данные. Причем текстовые файлы и графика хранятся в отдельных документах.
Чтобы увидеть содержимое docx-файла можно изменить его расширение на zipи открыть в любом архиваторе. Чтобы открыть документ-docxв ранних версиях Word, необходимо скачать и установить «Пакет обеспечения совместимости Microsoft Office для форматов файлов Word, Excel и PowerPoint»
ODT/ODF (Open Document Format)
21 декабря 2010 года Федеральным агентством по техническому регулированию и метрологии России открытый формат для офисных документов Open Document (ODF) был зарегистрирован в качестве государственного стандарта.
ODT/ODF (Open Document Format), разработан сообществом OASIS, на основе HTML. Это открытый формат, который может использоваться без ограничений и является альтернативой форматам Microsoft.