Методи за компресия на мултимедийна информация

В допълнение, ние ще подробно основните принципи, залегнали в алгоритмите на компресия на мултимедийни данни, които могат да се свият до размера на миналото, за истински предаване през Интернет.

Класификация на компресия на данни

За да започнете, нека да се определи степента на компресия, за да продължи, за да изберете най-подходящия за предаване на информация чрез Интернет. Ние извърши класификация на видовете компресия от степента на загуба на качеството.

1. компресия без загуби

2. Компресия със загуби

2.1. Lossless компресия е Възприемане

2.2. Компресиране с естествена загуба

С други думи, в този случай, така наречената естествена деградация на изображението, с която е ощетена с малки части от сцената. Срещи могат да се появят в ин виво, като при дъжд или мъгла. Изображението в тези условия е по принцип се различава, обаче, с подробности за него се намалява.

2.3. Компресия със загуба на качество неестествено

Ниско качество на компресия, до голяма степен изкривява образа и се прилага изкуствено в него (не съществуват в оригиналните) детайлите на сцената, наречена неестествено компресия със загуби. Пример за това е някакъв "на блокиране" в силно компресиран MPEG, т.е. в други компресори, използващи BDKP технология.

Неестественост е преди всичко в нарушение на най-важните от гледна точка на човешкото възприятие на характеристиките на изображението - вериги. Опитът показва, че тази схема позволява на човек да се идентифицират правилно определен визуален обект.

Компресиране на мултимедийни данни за представяне в интернет

Така че нека да погледнем по-отблизо на принципите, залегнали в всеки един от тези алгоритми и методи за компресия на мултимедийна информация.

MPEG-4. Какво е това?

Принципи на работа на алгоритъм за компресиране MPEG-4

Въпреки това, MPEG-4, с изключение счита конвенционален MPEG-кодиране, базирани на правоъгълни рамки използва технологията на т.нар фрактал или контур на базата на кодиране на изображението.

Бази фрактал кодиране на изображението

За да разберем принципите на контура на основата на кодиране на изображението, се отнася и за MPEG-4, разбирам себе си няколко прости идеи.

Contour - линия очертае данните за граници на самолета. Texture - изображение представяне на повърхността на структурата. Contour базирани кодиране на изображения е образ, като контур, пликове текстура участък (област пълни текстури). И тъй като контурите са обикновено съвпадат с границите на обекти в сцена изобразен, проблемът на контура на основата на кодиране се свежда до проблема за обектно-базирани кодиране на изображения, а именно изображение представлява от набор от нейните съставни обекти.

Излишно е да казвам, проблемът на контура на основата на кодиране в момента е един от най-обещаващите и, може би, един от най-много трудоемко (по отношение на изчисление).

отделни обекти

Какво е DivX?

Това означава, че в действителност, това е алгоритъм не се поддържа официално, поне в тази версия, обаче, DivX е базиран на формат MPEG-4.

DivX красота на алгоритъма е, че филма с продължителност до три часа може да се компресира до обем удобно на един CD, което е два пъти по-ниска от тази на MPEG-1, а резултатът ще бъде по-добро качество на картината, особено по отношение на резолюцията. Се появи на пазара дискове с филми в MPEG-4 стандарт - при такава употреба DivX алгоритъм. Тяхната стойност в момента варира от 50 до 100 рубли в зависимост от качеството и съдържанието. Източникът обикновено се използва DVD. Повечето от филмите, записани в 16: 9 формат, не дава по-добра представа на монитора, но качеството на тези филми, са склонни да бъдат по-високи от филмите с обичайния формат 4: 3. Освен това, колкото по-малка от дължината на филма, толкова по-голяма скоростта на предаване може да се използва, за да запълни цялото пространство на диска. Разбира се, в този случай качеството е по-високо.

Да предположим, че някои мистериозен начин имам DVD-диск с добър филм. Благодарение на DivX технология, можете да спестите филмовия файл в, да речем, на вашия твърд диск, а дори приличен това свиване на обема, макар и с известна загуба на качество. Впоследствие, в резултат на компресиран файл може да се запише на CD-R, както и всеки друг файл, и да го използвате в точното време.

Ако нямате желание или възможност да се включат в себе си компресия, че е възможно да се използват готовите продукти, обемът на който се разраства бързо.

За MPEG Layer 3, а не само

За ефективно кодиране на аудио данни в най-напредналите уеб прилагат методи, които се базират на имуществото на тяхната гъвкавост и независимост от качеството на оригиналния саундтрак, както и в резултат, в зависимост от настройките, използвани по време на компресия.

В момента, най-известният Audio MPEG, PASC и ATRAC. Те се използват т.нар възприятие, кодиращ (перцептуално кодиране), където звуковия сигнал се отстранява от информацията, ненатрапчив на ухото. В резултат на това, че въпреки промяната във форма и спектъра на сигнала, неговата слухови възприятие остава почти непроменена, а коефициентът на компресия оправдава лек спад в качеството. Това кодиране се отнася до метод за компресиране със загуби, когато от компресирания сигнал вече е невъзможно точно да се възстанови оригиналната форма на вълната.

Методи за отстраняване на част от информацията на базата на особеностите на човешкия слух, наречен маскиране: присъствието на слаби честотни компоненти в близост до тях едва възприема от ухото на звука изразени пикове (преобладаващата хармонична) спектър (маскиран). Когато кодираща цялата аудио поток се разделя на по-малки рамки, всяка от които се превръщат в спектрална представяне и е разделен на множество честотни ленти. В ленти е откриването и отстраняването на маскиране звуци, тогава всеки кадър е кодирана директно в адаптивния спектрална форма. Всички тези операции могат значително (няколко пъти), за да се намали количеството на данни при запазване на качеството, което е приемливо за повечето слушателите.

Всяка от описаните методи за кодиране се характеризира със скоростта, при която компресирана информация трябва да пристигнат в декодера на възстановяване аудио сигнал.

Декодерът превръща сгъстен серия от моментната спектри сигнал по конвенционален цифрова форма на вълната.

Audio MPEG - техники за аудио компресия група стандартизираните MPEG (Moving Pictures Experts Group - експертната група за обработка на движещи се изображения).

Информацията в MPEG-файл записан последователни блокове - рамки (рамки), които са последователно четат, а след това се декодира. Естествено, толкова по-голям поток, толкова по-голямо количество информация е във файла и, съответно, по-голям е представителството на оригиналния звук, които съдържа.

Audioinfopmatsiya, сгъстен от тази схема може да pepedavatsya поток (стрийминг), и може да се съхранява в MP3 файлов формат WAV или MP3-. Разликата от първата секунда е наличието на допълнителен удар с глава на WAV-файл, което позволява наличието на MP3-кодек система да работи с такъв файл с помощта на стандартни инструменти на Windows.

Основната идея се основава на ексцентричността всички техники за компресиране aydiosignala с potepi - отказ на kodipovaniya фини детайли zvychaniya opiginala лежи извън между границите на човешките възможности slyha. Звуци, които са на границата на разлика рязка ниво: след много силен звук по време на кратък интервал от време от около 100 милисекунди, а пред него в продължение на 5 мс, човешкото ухо не е в състояние да възприемат другите, по-тихи звуци.

Като говорим за това, обикновено се има предвид възможността за осъзнаване, игнорирайки честите ефект на подсъзнателно възприемане на различни малки, сравнително тихи части; които ги използват, например, често са условие емоционална оцветяване състав. Но ако по време kodipovanii още ogpanichivatsya само наистина незабележимо загуба, можете да govopit sohpanenii от първоначалното качество на кодирана aydio.

Както е известно, най-важната роля да играе на аудио излъчвания сигнал върхове на плика, а преходи в близост до нула може да бъде принесен в жертва (вж. Фиг. 1).

След тази обработка на звука проба лесно сгъстен използват конвенционални кодиращи алгоритми LZ или Huffman.

Същността на кодиране според съвместната стерео Техниката е само ТРАНСФОРМАЦИИ stepeosignala в средния сигнал между каналите и разликата между тях. Но това е само един вариант на съвместно стерео, наречена MS Stereo. При много ниски потоци, като 96 Kbit / и, се прилага MS / IS Стерео техника, при която за някои честотни ленти, вместо разликата между каналите съхраняват само информация за съотношението на сигнала в различни канали. FhG IIS продукти, така кодира само високите честоти, но някои енкодери позволяват да изберете желания обхват ръчно. За съжаление, изборът е да се уточни на желаната стойност на една от вътрешните променливи неубедителен формат, не е обяснено в документацията.

Окончателно vepsii vysheypominaemoy физикоакустичният модел не съществува, нито пък има алгоритъм, при определено standaptnogo kodipovaniya. В тази връзка, по принцип slychae oschytimosti обем и степента на загуби на която се определя от един stopony, поток, и с dpygoy - разполага konkpetnoy модел psihoakysticheskoy председател Вид използва във всяка konkpetnoy програмист. Последното е особено важно при ниски потоци. Има nabop ефекти, които тези потоци да реагират едва ли kodipovaniyu.

И още един елемент от човешкото ухо е било взето под внимание при разработването на алгоритъм за компресиране - използването на минимален праг на чуваемост. Най-високата чувствителност (2-4 децибела) слухови органи имат среден честотен диапазон от 2-5 кХц. В други честоти праговата стойност чувствителност може да бъде с обем от 40 db. С други думи, звуци, които лежат отвъд прага на чувствителност, то няма смисъл да се поддържа, тъй като те все още могат да бъдат чути.

Въз основа на тези ефекти се създава така наречената физикоакустичният модел, разделяне на целия честотен спектър на част, в която нивото на звука е приблизително една и съща, а след това премахва звуци не се възприема от лицето, както е описано по-горе.

Има три нива на Audio MPEG компресиране на стерео сигнали:

1 - компресия 1: 4 с приемлив поток данни 384 Kbit / сек;
1 - 2: 6..1: 256..192 на 8 кбит / сек;
3 - 1: 10..1: 128..112 при 12 Kbit / сек.

Сега нека да се опитаме да разберем каква е разликата между нивата (слоя). Например, Layer 3 част счупен спектър много по-малко, отколкото в първите две, и натиск поради тази причина този метод е най-продуктивните и нейният коефициент достига 1:12 без забележима загуба на качество в ухото. Ето защо, като широко разширителни файлове MP3 (MPEG Layer 3).

За аудио CD с качество, необходимо за компресиране на аудио поток 256 Kbit / s, но за повечето слушатели и в повечето приложения е достатъчно 128 Kbit / сек (при 64 Kbit / и на канал). Въпреки това, сред твърде много енкодери MP3-файлове трябва да бъдат отбелязани няколко, което позволява да компресирате аудио брой поток променлива (променлива скорост на предаване), като по този начин осигурява максимално качество и спестяване на дисково пространство. В основата на тези кодеци е да се използва по всяко време определена стойност на потока, и следователно, времето различна природа на аудио сигнала (честотата и амплитудата на звуковите вибрации). За речта на компресия с отлично качество на достатъчно 24 или 32 Kbit / сек.

Изграждането на много физикоакустичният модел - сложна математическа процес, изпълнен с плаваща запетая изчисления. В резултат на това един такъв процес, както и процеса на компресия Хъфман, изисква солидна процесорна мощ и при декодиране файлови формати MPEG, и най-вече - за кодиране. Първоначално тя се използва за тази цел, специализирани устройства за извършване на всички математически преобразувания на хардуерно ниво, и то само през последните години, след появата на мощни процесори, които могат да се справят с тези изчисления, без да се засягат други приложения, то е станало възможно с помощта на специални програми.

Изявление на проблема

Освен това, трябва да се разработи два спомагателни компонент:

Какво ни е нужно?

За изпълнение на втория компонент трябва да е OLE-вграждане на Windows Media инстанция на обект незаменим за всички наши потенциални студенти, които, всъщност, ще се представят буфериране и стрийминг. Въпреки това, той остава неясно начин да мине параметър, от една страна, Windows Media обект е вграден в HTML-документа, и второ, тя е проведена ресурса поточно възпроизвеждане.

а вторият - HTML- от следните маркери:

Така че, на първо място за правилното възпроизвеждане на мултимедийно ресурс, трябва да го на MIME-тип се регистрирате. Горната тип "аудио / MP3 съответства на MIME-тип аудиозапис MP3 формат. Във втория случай е посочено ASP-страница на файл, вграждането на компонента извършва последващо възпроизвеждане параметър допълнително показва #stream, което показва, че възпроизвеждане ще се извършва в режим на потока.

За да се определи подходящ MIME-тип от всякакъв вид е различен формат за данни (в този случай, AVI формат), трябва да използвате MIME-Конфигуратор програма Интернет услуги мениджър (вж. Фиг. 2).

подаване на данни

В този случай, фрейм (File index.asp) могат да бъдат представени, както следва:

Освен това е необходимо да се подготви PlayList.asp Player.asp страници и за изпълнение на първия и втория компонент контакт възложените задачи.

Сега трябва да се създаде списък на съдържанието на тази виртуална директория с MP3-музика, както и с кранове в поддиректории, като по този начин формират всички поддиректории на указаното дървото. За по-лесно разбиране в рамките на тази статия, ние ще го направим за едно ниво на влагане; По-късно тя ще бъде възможно да се произвежда и до неограничен ниво на гнездене.

За всеки аудио файл, трябва да се създаде връзка, за да слушате на страницата (в долната рамка), минавайки като параметър името на аудио файл и настройката на режима за стрийминг.

Както можете да видите, програмата започва да се възстанови реалната физическа пътя към ресурси Аудио: FolderPath = Server.MapPath ( "Музика"), където музиката - не е нищо друго освен едно име (псевдоним) на нашата виртуална директория.

На следващо място, с помощта на които вече са известни за нас, въз основа на предишните функции на група от статии за работа с файловата система, изпълнявани преминава през всички поддиректории на определен физически пътя, където за всеки да се генерира списък с поддиректории и определени файлове в функция директория, наречена ListFolders, които, от своя страна, ListFiles предизвиква функцията за генериране на списък с линкове към аудио в рамките на една поддиректория.

Най-накрая, дойде ред на втория компонент, извършване на възпроизвеждане на аудио файлове:

Както можете да видите, компонентът е просто генерира HTML тагове, които вгражда копие на Windows Media обект директно в страницата.