Какая информация содержится в расширении файла
Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 23 сентября 2017;
проверки требуют 5 правок.
Расширение имени файла (англ. filename extension, часто говорят просто расширение файла или расширение) — последовательность символов, добавляемых к имени файла и предназначенных для идентификации типа (формата) файла. Это один из распространённых способов, с помощью которых пользователь или программное обеспечение компьютера может определить тип данных, хранящихся в файле, например: имя.jpg это фотографии, имя.avi — видео и т.п.
Расширение обычно отделяется от основной части имени файла точкой. В операционных системах CP/M и MS-DOS длина расширения была ограничена тремя символами, в современных операционных системах это ограничение отсутствует. Иногда могут использоваться несколько расширений, следующих друг за другом, например, «.tar.gz».
В файловой системе FAT16 имя файла и расширение являлись отдельными сущностями, а точка, разделявшая их, реально не являлась частью полного имени файла и служила лишь для визуального отделения имени файла от расширения. В файловых системах FAT32 и NTFS точка стала обычным разрешённым символом в имени файла, поэтому ограничения на количество точек в имени файла в этих системах и их местоположения были сняты (за некоторыми исключениями, например, все конечные точки в именах файлов просто отбрасываются).
Некоторые операционные системы или менеджеры файлов могут устанавливать соответствия между расширениями файлов и приложениями. Когда пользователь открывает файл с зарегистрированным расширением, автоматически запускается соответствующая этому расширению программа. Некоторые расширения показывают, что файл сам является программой.
Точность указания[править | править код]
Иногда расширение указывает формат лишь в общем (например, расширение .doc использовалось для множества различных форматов текста — как простого, так и форматированного; а расширение «txt» не даёт никакой информации о том, в какой кодировке текст в файле), из‑за чего необходимо использовать и другие способы определения формата.
Иногда расширение указывает только один из используемых в файле форматов (например, расширение «.ogg» первоначально использовалось для всех файлов в формате Ogg, независимо от кодеков, которыми закодированы содержащиеся в контейнере Ogg данные). Также расширение обычно не указывает версию формата (например, файлы в разных версиях XHTML могут использовать одни и те же расширения).
Другие способы указания формата[править | править код]
- В некоторых операционных системах и файловых системах (например, HFS) информация о формате файла хранится в самой файловой системе.
- Магические числа — последовательности байтов внутри самих файлов.
- Shebang — в Unix‐подобных ОС ставится в начале исполняемого файла для указания интерпретатора, который должен вызываться при запуске этого файла. Состоит из символа комментария (#) и восклицательного знака (!), после которого указывается команда, которую требуется выполнить с данным файлом в качестве аргумента.
См. также[править | править код]
- Список форматов файлов
Ссылки[править | править код]
- Список расширений по типам
- HowOpen.org
- Расширения, форматы файлов
- File-Extension.info/RU
- File-extensions.org (англ.)
- Dot What? (англ.)
- Filext (англ.)
- Список самых популярных расширений файлов
Формат файла, формат данных — спецификация структуры данных, записанных в компьютерном файле. Идентификатор формата файла, как правило, указывается в конце имени файла в виде «расширения». Расширение имени файла помогает идентифицировать формат данных, содержащихся в файле, программам, которые могут с ним работать. Иногда формат данных дополнительно указывается в начале содержимого файла.
В операционной системе для определения программы, которая может открыть какой-либо файл, применяется сопоставление (ассоциирование) файлов и программ.
Например, окончание имени (расширение) «.txt» обычно используют для обозначения файлов, содержащих только текстовую информацию, а «.doc» — содержащих текстовую информацию, структурированную в соответствии со стандартами программы Microsoft Word. Файлы, содержимое которых соответствует одному формату (реже — одному семейству форматов), иногда называют файлами одного типа.
Так как общепринятая в вычислительной технике концепция файла — неструктурированная последовательность байтов, компьютерные программы, сохраняющие структурированные данные в файлы, должны как-то преобразовывать их в последовательность байтов и наоборот (в ООП эти операции называются, соответственно, «сериализацией» и «десериализацией»; для текстовой информации последнее также называется «разбор» или «парсинг»). Алгоритм этих преобразований, а также соглашения о том, как различные фрагменты структурированных данных располагаются внутри файла, и составляют его «формат».
Различные форматы файлов могут различаться степенью детализации, один формат может быть «надстройкой» над другим или использовать элементы других форматов. Например, текстовый формат накладывает только самые общие ограничения на структуру данных. Формат HTML устанавливает дополнительные правила на внутреннее устройство файла, но при этом любой HTML-файл является в то же время текстовым файлом.
Другой пример — структура компьютерных программ — исполняемых файлов: она должна строго соответствовать некоторым ожиданиям (спецификации) запускающей её операционной системы.
Спецификации[править | править код]
Для многих форматов файлов существуют опубликованные спецификации, в которых подробно описана структура файлов данного формата, то, как программы должны кодировать данные для записи в этот формат и как декодировать их при чтении. Большинство таких спецификаций свободно доступны, некоторые распространяются за плату.
Иногда компании могут считать определённые форматы файлов своей коммерческой тайной и не публиковать их. Хорошо известный пример — форматы файлов пакета Microsoft Office. Однако, с переходом на открытый формат Office Open XML, компания Microsoft, все же опубликовала спецификации форматов под OSP[en][1][2][3]. В некоторых случаях компания, выпустившая приложение, просто не считает нужным тратить время на написание подробной спецификации.
Если спецификация формата недоступна, то для обеспечения совместимости программы с данным форматом приходится заниматься обратной разработкой. В большинстве или во всех странах форматы файлов не защищены законами об авторских правах. Однако в некоторых странах патентами могут быть защищены алгоритмы, используемые для кодирования данных в какой-либо формат. Например, в широко распространённом формате GIF использовался патентованный алгоритм (срок действия патентов в разных странах истек в 2003—2004 гг.), что привело к разработке альтернативного формата PNG.
Определение типа файла[править | править код]
Тип файла — это информация для быстрой идентификации содержимого файла операционной системой и пользователем без необходимости считывания всего содержимого файла. Благодаря этой информации пользователь приблизительно знает тип содержащейся информации в файле, а в операционной системе может быть сопоставлена программа для обработки файлов данного типа.
Для того, чтобы правильно работать с файлами, программы должны иметь возможность определять их тип. По историческим причинам, в разных операционных системах используются разные подходы для решения этой задачи.
Расширение имени файла[править | править код]
Некоторые операционные системы, например, CP/M, RT-11, DOS и Microsoft Windows, используют для определения типа файла часть его имени, то есть «расширение имени файла». В старых операционных системах это были три символа, отделённые от имени файла точкой (в файловых системах семейства FAT имя и расширение хранились отдельно, точка добавлялась уже на уровне ОС); в более новых системах расширение может являться просто частью имени, и тогда его длина ограничена только неиспользованной длиной имени (которая может составлять, например, 255 символов). Например, HTML-файлам может соответствовать расширение «.htm» или «.html».
Пользователь может свободно изменить расширение файла. Поскольку многие оболочки пользователя используют расширение, чтобы определить программу, с помощью которой нужно открыть файл, это может сделать последний недоступным для работы или вообще «потерянным», если пользователь забудет исходное расширение. Поэтому Windows Explorer по умолчанию скрывает расширения. Эта практика имеет и обратную сторону: так как расширения файла не видно, можно обмануть пользователя, заставив его думать, что, например, файл с расширением .exe — изображение с другим расширением. В то же время опытный пользователь может использовать возможность изменить назначенный файлу тип, просто сменив расширение, чтобы открыть его в другой программе, не указывая её напрямую. Это может быть полезно, если в программе не предусмотрено открытия файлов с каким‑то расширением, а пользователь знает, что их формат подходит для обработки в данной программе.
Магические числа[править | править код]
Другой способ, широко используемый в UNIX-подобных операционных системах, заключается в том, чтобы сохранить в самом файле некое «магическое число» (сигнатуру) — последовательность символов, по которой может быть опознан формат файла. Первоначально этот термин использовался для специального набора 2-байтовых идентификаторов, сохраняемых в начале файла (эта практика перекочевала и в другие ОС, например, MZ в MS-DOS), однако, любая последовательность символов, характерная для данного формата, может быть использована как «магическое число».
Для определения формата файла служит команда file, которая использует файл /usr/share/misc/magic
$ file /bin/ls
/bin/ls: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), dynamically linked (uses shared libs), for GNU/Linux 2.6.18, stripped
$ file notes.txt
notes.txt: UTF-8 Unicode text
$ file leave_2009-10-12.odt
leave_2009-10-12.odt: OpenDocument Text
Строки с так называемыми «шебангами» в файлах скриптов — особая разновидность «магических чисел». Здесь сигнатура — человекочитаемый текст, который определяет программу — интерпретатор скрипта.
Метаданные[править | править код]
Некоторые файловые системы позволяют сохранять дополнительные атрибуты для каждого файла, то есть «метаданные». Эти метаданные можно использовать для хранения информации о типе файла. Такой подход используется в компьютерах Apple Macintosh. Метаданные поддерживаются такими современными файловыми системами, как HPFS, NTFS, ext2, ext3 и другими. Недостатком этого метода является плохая переносимость — при копировании файлов между файловыми системами разных типов метаданные могут быть потеряны.
MIME[править | править код]
Типы данных, определённые стандартом MIME, широко используются в различных сетевых протоколах, однако в файловых системах они пока применяются редко.
См. также[править | править код]
- Расширение имени файла
- Список форматов файлов
- Типы файлов (UNIX)
Примечания[править | править код]
Ссылки[править | править код]
- Энциклопедия форматов файлов (англ.)
- fileext.ru — Описание форматов, типов и расширений файлов. Чем открыть файлы различных форматов. (рус.)
- fileformats.ru — База расширений файлов и типов файлов. (рус.)
- Magic signature database — Standard file format information and FFID registry (англ.)
- Format wars File formats for websites and print explained (англ.)
- File signatures (aka magic numbers) found in files to indicate their file type (англ.)
- dotwhat.net — File extension and format information (англ.)
- PRONOM technical registry (англ.)
- Library of Congress file format information (англ.)
Расширение файла или расширение имени файла является суффиксом в конце компьютерного файла. Оно обычно имеет длину два-четыре символа. Если вы когда-либо открывали документ или просматривали изображение, вы, вероятно, заметили эти буквы в конце вашего файла.
Для чего используется расширение имени файла
Расширения файлов используются операционной системой для определения того, какие приложения связаны с типами файлов — другими словами, какое приложение открывается при двойном щелчке по файлу.
Например, файл с именем «awesome_picture.jpg» имеет расширение файла «jpg». Например, когда вы открываете этот файл в Windows, операционная система ищет любое приложение, связанное с файлами JPG, открывает это приложение и загружает файл.
Уничтожение удаленных данных с любого устройства
Что нужно сделать, что бы удаленный файл нельзя было восстановить.
Какие существуют типы расширений?
Существует много разных типов расширений файлов — слишком много, чтобы их можно было перечислить в одной статье, но вот несколько примеров общих расширений файлов, которые вы можете увидеть на своем компьютере:
DOC / DOCX: документ Microsoft Word. DOC был оригинальным расширением, используемым для документов Word, но Microsoft изменила формат, когда дебютировал Word 2007. Документы Word теперь основаны на формате XML, поэтому добавление «X» в конец расширения.
XLS / XLSX: — Электронная таблица Microsoft Excel.
PNG: Portable Network Graphics, формат изображения без потерь.
HTM / HTML: формат разметки HyperText для создания веб-страниц в Интернете.
PDF: Формат переносимого документа, созданный Adobe и используемый для поддержки форматирования в распределенных документах.
EXE: исполняемый формат, используемый для программ, которые вы можете запустить.
И, как мы уже говорили, это просто небольшое количество расширений файлов. Существует их, буквально тысячи.
Также важно знать, что существуют типы файлов, которые по своей сути опасны и могут быть опасными. Как правило, это исполняемые файлы, которые могут запускать определенные типы кода при попытке их открыть.
Не открывайте файлы, если они получены из ненадежного источника.
В оригинальной статье, найдешь 50+ расширений файлов, которые потенциально опасны для Windows
Что делать, если я не вижу расширения файлов в моих файлах?
По умолчанию Windows показывает расширения файлов. Некоторое время — в Windows 7, 8 и даже 10 — это было неверно, но, к счастью, они изменили настройки по умолчанию.
Мы говорим, что показ расширений файлов не только полезен, но и более безопасен. Без показа расширений файлов может быть трудно определить, является ли этот файл PDF, который вы смотрите (например), действительно файлом PDF, а не каким-то вредоносным исполняемым файлом.
Если расширения файлов не отображаются в Windows, достаточно легко вернуть эту информацию. В любом окне проводника файлов просто выберите «Просмотр»⯮ «Параметры»⯮ «Изменить папку» и параметры поиска.
Выбираем облачное хранилище файлов
Что является важным при выборе облачных сервисов.
В окне «Параметры папки» на вкладке «Вид» установите флажок «Скрыть расширения для известных типов файлов».
В macOS расширения файлов не отображаются по умолчанию. Причина этого заключается в том, что macOS на самом деле не использует расширения так, как это делает Windows (и об этом мы поговорим больше в следующем разделе).
Однако вы можете делать расширения файлов MacOS и это, вероятно, не так уж плохо. Открыв Finder, просто перейдите в Finder⯮ Preferences⯮ Advanced, а затем включите флажок «Показать все расширения файлов».
Как MacOS и Linux используют расширения файлов?
Итак, мы говорили о том, как Windows использует расширения файлов, чтобы узнать, с каким типом файлов он имеет дело, и какое приложение использовать при открытии файла.
Windows знает, что файл с именем readme.txt является текстовым файлом из-за этого расширения TXT-файла, и он знает, как открыть его с помощью текстового редактора по умолчанию. Удалите это расширение, и Windows больше не будет знать, что делать с файлом.
Как сделать абсолютно невидимую папку в Windows 7, 8 и 10
Существует хитрый способ создать в Windows такую папку, которая не будет видна, даже если включить отображение скрытых файлов и папок.
Хотя MacOS и Linux по-прежнему используют расширения файлов, они не полагаются на них, как Windows. Вместо этого они используют что-то типа MIME и коды создателей, чтобы определить, что такое файл. Эта информация хранится в заголовке файла, и как macOS, так и Linux используют эту информацию для определения того, с каким типом файлов они имеют дело.
Поскольку расширения файлов на самом деле не требуются в macOS или Linux, вы вполне можете иметь действительный файл без расширения, но ОС все равно может открыть файл с помощью правильной программы из-за информации о файле, содержащейся в заголовке файла.
Что произойдет, если я изменю расширение файла?
Основываясь на том, о чем мы только что говорили в предыдущем разделе, что произойдет когда вы меняете расширение своего файла, зависит от того, какую операционную систему вы используете.
В Windows, если вы удаляете расширение файла, эта операционная система больше не знает, что делать с этим файлом. Когда вы попытаетесь открыть файл, Windows спросит вас, какое приложение вы хотите использовать. Если вы измените расширение, скажите, что вы переименовали файл с «coolpic.jpg» в «coolpic.txt» -Windows попытается открыть файл в приложении, связанном с новым расширением, и вы получите сообщение об ошибке или открытый, но бесполезный файл.
В этом примере Блокнот (или любой другой текстовый редактор по умолчанию) открыл наш файл «coolpic.txt», но это всего лишь искаженный беспорядочный текст.
По этой причине Windows предупреждает вас, когда вы пытаетесь изменить расширение файла, и вы должны подтвердить действие.
Если вы используете macOS, происходит нечто подобное. Если вы попытаетесь изменить расширение файла, вы получите предупреждение.
Если вы измените расширение на что-то еще, macOS попытается открыть файл в приложении, связанном с новым расширением. И вы получите сообщение об ошибке или искаженный файл — как в Windows.
Если вы действительно хотите изменить тип файла — например, вы хотели бы изменить изображение из формата JPG в PNG — вам нужно будет использовать программное обеспечение, которое может фактически преобразовать файл.
Как изменить программу, открывающую файл
Всякий раз, когда вы устанавливаете приложение, которое может открыть определенный тип файла, это приложение и расширение файла регистрируются в вашей операционной системе. Вполне возможно, что несколько приложений могут открывать один и тот же файл.
Вы можете запустить приложение, а затем загрузить в него любой поддерживаемый тип файла. Или вы можете щелкнуть правой кнопкой мыши файл, чтобы открыть его контекстное меню и выбрать там доступное приложение.
Например, на изображении ниже вы можете увидеть, что у нас есть несколько приложений для изображений в нашей системе Windows, которые могут открыть файл «coolpic.jpg», который мы щелкнули правой кнопкой мыши.
Тем не менее, есть также приложение по умолчанию, связанное с каждым расширением. Это приложение открывается при двойном щелчке по файлу, а в Windows это приложение, которое появляется в верхней части списка, которое вы получаете, когда вы щелкаете правой кнопкой мыши файл (на изображении выше).
И вы можете изменить это приложение по умолчанию. Просто выберите «Параметры»⯮ «Приложения»⯮ «Приложения по умолчанию»⯮ «Выбрать приложения по умолчанию по типу файла». Прокрутите список (очень длинный) типов файлов, чтобы найти тот, который вы хотите, а затем щелкните связанное с ним приложение справа, чтобы изменить его.
И вы можете сделать то же самое в macOS. Просто выберите файл типа, который вы хотите изменить, и выберите «Файл»> «Получить информацию» в главном меню. В появившемся окне «Информация» перейдите в раздел «Открыть с», а затем в раскрывающемся меню выберите новое приложение. Достаточно легко.
Теперь вы знаете что такое расширение файла, и как его изменить.