COMPARATIF COMPRESSION AUDIO MPEG-4

COMPARATIF DES SPECTRES

TESTS DE RESTITUTION

Par Proger - mai-aout 2003

 


le MP3 a été créé par l'institut iis Fraunhofer, en allemagne, avec la participation de Thomson . Il permet de passer d'un bitrate (quantité d'infos par seconde) de 1411kbps (cdaudio) à 128kbps avec la même qualité audio perçeptible par une oreille distraite, soit un rapport de compression environ 1:12

Le MP3 est apparu en 1995, et souffre de différente limitations :
- bande passante audio limité
- nombre de canaux audio limité
- sérieux problèmes de déformation des hautes fréquences

Pour compenser ces phénomènes, le MP3pro est une version amélioré du mp3, restituant les sons aigués, tout en limitant la taille du fichier.

Des essais montre que le système est efficace, à condition d'avoir un décompresseur de mp3pro, sinon le fichier audio sera considéré comme un mp3 de mauvaise qualité !

Le MP3pro sera-t-il le remplaçant du mp3 dans le futur ? Car il faut bien un remplaçant pour le mp3, cette vetusté!
Il n'y a pas encore de réponse concluante, car il y a une forte concurrençe pour la succession du mp3!

Codec MPEG-4 : voici les différents nouveaux formats voulant se substituer au MP3 :
- WMA microsoft windows media audio
- MP3pro thomson mp3 professional
- VQF ntt vector quantization filter
- AAC fraunhofer advanced audio coding, parfois appelé MP4
- OGG xiph.org ogg vorbis
- MPC musepack, aussi appelé MPP (non testé faute de pouvoir contrôler le bitrate)

Télécharger ici les plugins pour Winamp2, pour pouvoir lire tout les formats sus-cités. A décompresser dans le dossier /plugins de winamp.

Codec MPEG4 pour windows (codec ogg uniquement).

Vous pouvez également trouver des compresseurs / encodeurs à cette adresse.

Note importante :
Les codecs "lossless" (compression audio sans pertes) ne sont pas "mpeg-4" et ne seront pas testé.
Liste des codecs "lossless" disponible :
- APE monkey's audio
- FLAC free lossless audio codec
- LPAC lossless predictive audio compression
- RKAU rk audio compression
- WavPack hybrid lossless audio compression
- Shorten softsound

 

Laboratoire : utilisé pour les tests sonore :
- système capable de réalisé la lecture en temps réel des fichiers sonore compressés
- logiciel d'analyse spectrale du signal (Cool Edit Pro 2 ici)
- musique riche en terme de fréquences, séparation stéréo préçise, dynamique et mélodie varié, qualité CD audio.
- système sonore haute fidélité : carte son à bon rapport signal/bruit, 144 dB de dynamique potentiel
- amplificateurs linéaire et hauts-parleurs haut de gamme (Cabasse, AKG).

Qualité CD audio :
Un CD audio, ou cd-a, contient des informations numérisées a propos du son enregistré. Cest données sont au format "pulse code modulation", c'est-à-dire que l'on enregistre le niveau de gain sonore entre deux intervalles de temps très bref et régulier. La loi de Shannon indique que si l'on souhaite enregistrer une fréquence sonore donnée, on doit utiliser un intervalle de temps égal au double de la fréquence; c'est ainsi que dans le cas du cd-a, pour enregistrer toute les fréquences audible par l'oreille humaine, (de 40Hz à 20KHz) on a choisi une fréquence de mesure de 44100KHz, alias fréquence d'échantillonage. Ensuite, pour placer sur une échelle de valeur fini (entre 0 et une borne maxi) le gain sonore, on choisi une résolution. L'informatique étant l'outil de numérisation, les créateurs du cd-a ont le choix parmi des résolutions multiples de 8 : 8 bits (256 positions possible pour le gain, soit 20 x log(256) = 48.1 dB de dynamique); 16 bits (65536 positions possible, soit 20 x log(65536) = 96.3 dB de dynamique) ou encore 24 bits (20 x log(16777216) = 144.4 dB). En se basant sur l'écriture traditionnelle de la musique, la différence entre le "pianissimo piano" et le "fortissimo forte" est de 92 dB, aussi les ingénieurs ont choisi la résolution 16 bits. L'oreille humaine est capable de différencier jusqu'a 130 dB de dynamique accoustique, mais la plupard du temps, le bruit ambient (brown noise) nous laisse perçevoir environ 80 dB de dynamique.

La source choisi est un fichier audio wave stéréo, echantillonnage 44100 hz en 16bps (bits per sample), format cdaudio.
(L'original faisant 58Mo au format wave, je ne le mets pas en téléchargement...)

 

TESTS : deux séries de tests ont été effectué, à des bitrates différent.

- TEST 1 : Le signal original a été compressé dans le mode "équivalent à la qualité cd" de tout les format mpeg connu, ce qui est majoritairement 96Kbps pour les codecs mpeg-4.
La conclusion de ce test montrera quel est le codec conservant au mieux l'information à faible bitrate d'une musique (utilisations potentiel : archivage, exportation)

- TEST 2 : compression et mesure du signal à 64Kbps CBR et VBR de tout les formats connus, comparé à l'original wave. Ainsi on teste quel codec mpeg conserve le mieux les données originales avec un bitrate imposé.
La conclusion de ce test montrera quel est le codec offrant une restitution fidèle à l'original, à très faible bitrate (utilisations potentiel : demo, streaming)

Note 1 : ces tests, fourni ici a titre indicatif, sont totalement indépendant des sociétés sus-cités ayant édité les logiciels et les codecs. Le matériel du laboratoire a été fourni de façon indépendante.

Note 2 : les images des spectres (spectrogrammes) disponible dans ces tests sont au format compressé Jpeg qualité 60. Dans un soucis d'exactitude, elles sont également disponible au format sans perte PNG 24bits.



 

Copyright (o) Proger 2003 [email]
Toute reproduction sans notification préalable est proscrite