Файлови формати - това

Форматът Терминът файл (или файл тип) се използва, за да опише структурата на данните. записано в компютърен файл.

Тъй като файлът е просто поредица от битове (т.е. нули и единици), компютърни програми. съхранява данните във файла трябва по някакъв начин да ги конвертирате обработена информация в поредица от битове, както и обратното (в ООП, тези операции се наричат ​​съответно "сериализация" и "deserialization"). Алгоритъмът на тази трансформация, както и споразумение за това как различните части на информацията след преобразуването се намира във файл, както и да представлява "формат".

Различни файлови формати могат да бъдат различни степени на детайлност, един формат могат да бъдат "надстройка" над другия, или да се използват елементи от други формати. Например, един текстов формат налага само най-общите ограничения за структурата на данните. формат

спецификация

Понякога предприятията считат, определени формати на своите търговски тайни досиета, а не да ги публикуват. Добре известен пример - форматите на Microsoft Office файлове. В някои случаи, компанията, която пусна приложение, просто не вижда нужда да прекарват време в писане на подробни спецификации.

Определяне на типа на файла

За да може правилно да работи с файлове, програми, трябва да могат да определят типа им. По исторически причини, различни подходи за решаване на този проблем се използват в различни операционни системи.

разширение на името на файла

Някои операционни системи, например, СР / М. Microsoft Windows се използва за определяне на типа на файла част на името си на. т. н. "Име разширение". При по-старите операционни системи, те са три знака, отделени от името на файла с точка (FAT файл име система семейство и разширение се съхраняват отделно, точки се добавят вече на ниво операционна система); в по-новите системи за разширение може просто да бъде част от името, и след това само неизползван дължина име е ограничено до дължина (която може да бъде, например, 255 знака). Например, HTML-файлове могат да съответстват на разширяването на «.htm» или «.html».

Потребителят може свободно да се промени разширението на файла. Тъй като много потребители, използване на разширението на обвивката за определяне на програмата, с която да се отвори файла, той може да направи последната недостъпна за работа или дори "губят", ако потребителят забрави оригиналното разширение. Ето защо, Windows Explorer крие разширение по подразбиране. Тази практика има един недостатък: тъй като разширението на файла не се вижда, може да подведе потребителя да мислят, че, например, файл с разширение .exe - изображение с различно разширение. В същото време, опитен потребител може да се възползва от възможността да промените типа на дестинация файл, просто чрез промяна на разширението за да я отворите в друга програма, а не да го сочи директно. Това може да бъде полезно, ако програмата не предвижда отваряне на файлове с някои разширение и потребителят знае, че форматът за преработка в тази програма.

Магически числа

Друг метод, който се използва широко в "магически номер" - последователност от символи, по които могат да бъдат идентифицирани от формата на файла. Първоначално терминът се използва за определен набор от от 2 байта идентификатори, съхранявани в началото на файла (тази практика не е мигрирала към други операционни системи), обаче, на последователност от знаци, характерни за този формат може да се използва като "магическо число".

метаданни

Някои файлови системи ви позволяват да съхранявате допълнителни атрибути за всеки файл, т.е.. Н. "Метаданни". Това метаданни може да се използва за съхранение на информация за типа на файла. Този подход се използва в компютрите на Apple Macintosh. Метаданни са подкрепени от напреднал файлови системи като NTFS, ext3 и други. Недостатък на този метод е лоша поносимост - при копиране на файлове между файловите системи на различни видове метаданни могат да бъдат загубени.

Типове данни, определени стандартни мрежови протоколи, но те все още рядко се използва в файлови системи.