COMPARATIF COMPRESSION AUDIO MPEG-4

ANALYSE SPECTRAL ET RESTITUTION à 96KbPS

Par Proger - mai-aout 2003

sommaire


Tests réalisés en compressant à 96Kbps en moyenne une musique sonore (sauf indication contraire).

Rappel : formats audios candidats MPEG-4 :
- WMA microsoft windows media audio
- MP3pro thomson mp3 professional
- VQF ntt vector quantization filter
- AAC fraunhofer advanced audio coding
- OGG xiph.org ogg vorbis

 

Tests : compressions effectuées :
- MP3 "classique" via codec Faunhofer pro, mode CBR 128Kbps haute qualité (référence)
- MP3 "classique" via codec Faunhofer pro, mode CBR 320Kbps haute qualité
- AAC via codec PsyTEL, mode CBR 96Kbps haute qualité
- OGG via codec de Xiph.org, mode VBR qualité 2.0 (équivalent 96Kbps)
- WMA via codec wma9 de Microsoft, mode CBR 80Kbps (dit équivalent à qualité cd)
- VQF via codec NTT, mode CBR 80Kbps haute qualité
- MP3pro via codec Thomson, mode CBR 96Kbps haute qualité

Le fichier original fait 57,8Mo
- à 96Kbps, la taille moyenne du fichier compressé est de 3,96Mo, soit un ratio de compression 1:14
- à 80Kbps, la taille moyenne du fichier compressé est de 3,30Mo, soit un ratio de compression 1:17

 

Note :
- "Hautes fréquences" correspond à la bande située entre 5000Hz et 14000Hz
- "Basses fréquences" correspond à la bande située entre 20Hz et 5000Hz

Le codec Fraunhofer pro n'est pas le codec le plus utilisé lorsqu'on compresse un son en MP3. Le plus répandu est LAME 3.91 et 3.93, qui offrent des fonctions compensant astucieusement les artefacts du MP3.

 


COMPARATIF DES SPECTRES

 

(note : les images ci-dessous ont été compressé en Jpeg haute qualité. La taille moyenne est de 140Ko par image, aussi elles ne s'afficheront pas instantanément. Le Jpeg étant un format de compression avec pertes de données, les images sont également disponible en version PNG 24bits ici)

Spectre de la musique originale :

Nous pouvons distinguer les deux voies, de bas en haut la fréquence (de 0 à 22050 hz) pour chacune des voies, et de gauche à droite la durée / position de lecture du son (5 minutes 44 secondes)

 

MP3 iso/iec

Spectre résultant de la compression via le codec original Fraunhofer à 128Kbps, connu comme "étant proche de la qualité cd" :

De toute évidence, le son est filtré à 16000 hz, et seul les pics de puissance sonore au-delà de cette fréquence sont enregistré.
Note : le codec Lame mp3 a une meilleure réponse spectrale, mais n'as pas été utilisé pour ce test. Des tests sont déjà disponible sur le net où l'on compare les différents compresseurs mp3 (xing, lame, blade, fraunhofer fast, fraunhofer pro,...). Lame est le compresseur mp3 le plus utilisé car il encode les très hautes fréquences, mais exige pour cela un bitrate minimum de 192Kbps, alors que Fraunhofer pro se permet de descendre à 112Kbps et joue sur la psychoacoustique pour compensé les très hautes fréquences perdues.

Une deuxième compression a été réaliser, avec le bitrate maximum autorisé pour le MP3 : 320Kbps

Même comportement que le 128Kbps, coupure à 16000Hz, mais conserve beaucoup plus de pic audio au-delà.
NOTE IMPORTANTE : il s'agit du codec MP3 Fraunhofer Pro, qui, selon les théories psychoacoustiques utilisées, supprime les fréquences inaudible pour une oreille conventionnelle, c'est-à-dire 16Khz - 18Khz. En revanche, le codec MP3 le plus répandu (LAME) respecte le spectre audio dans les très hautes fréquences (19Khz et plus...) ce qui change le spectrogramme et plaçerai le mp3 en première position de ce test...

 

AAC

Spectre résultant de la compression via le codec PsyTEL, forçé à 96Kbps.

L'AAC étant basé sur l'idée du mp3, on retrouve le principe de couper le signal aux alentour de 16000Hz, mais l'AAC garde beaucoup plus d'information au-delà. Les basses fréquences sont conservées à l'exacte par rapport à l'original, avec un premier seuil de différence à 1000Hz, où en-deçà le signal est identique à 99% de l'original, et un deuxième à 6000Hz, où au-delà les informations audios diffèrent à plus de 90%, tout en restant discrètes.

 

OGG

Spectre résultant de la compression via OGG vorbis codec, à 96Kbps.

On note que les hautes fréquences sont filtrées au-dela de 16000 hz, néanmoins beacoup d'informations sont gardées jusqu'à 22050 hz, plus que dans le format AAC. Les basses fréquences sont conservées à l'identique par rapport au son original, mais moins que dans le cas de l'AAC : le deuxième seuil serai à 4000Hz

 

WMA

Spectre résultant de la compression via le codec wma9, en mode 80Kbps. Microsoft indiquai que 64Kbps était le bitrate "proche de la qualité cd", et différents essais non publiés ici ont montré que le spectre varie très peu au-delà de ce bitrate.

L'image montre que ce format coupe net le signal aux alentours de 14000Hz et n'enregistre de ce fait aucune informations audios au-delà. A l'écoute, ce "manque de hautes fréquences" est notable, ce qui rend le fichier sonore vraiment trop distant de l'original. Les basses fréquences sont conservées, à l'instar du AAC, mais contient toujours de légères nuances, bien en-deçà de 1000Hz

 

VQF

Spectre résultant de la compression via le dernier codec de NTT, 80Kbps en mode haute qualité.

A l'instar du MP3pro, seul le vqf enregistre les informations audios sur l'ensemble du spectre de fréquence. Mais ceci n'est qu'une apparence, car en comparant les deux spectres (original et vqf) on s'aperçois qu'il y a énormément de différences : les hautes fréquences sont atténuées progressivement jusqu'à la limite 22050 hz, en total contradiction avec la musique originale. Les basses fréquences diffèrent du signal original.

 

MP3pro

Spectre résultant de la compression via le codec de Thomson, mode 96Kbps.

Tout comme le VQF, le MP3pro garde l'ensemble des informations audios jusqu'à la limite des 22050Hz. Néanmoins en aucun cas l'image du spectre du son original ne correspond à celui du MP3pro, tel que le VQF. La différence avec ce dernier réside dans le fait que le MP3pro conserve beaucoup plus la continuité des puissances audios en montant en fréquences (pas de baisse progressive).

 

 

En conclusion, en classant dans l'ordre du codec conservant au mieux l'image du spectre, on obtient :

1) OGG , montant le plus haut en fréquences
2) AAC , gardant plus d'informations basses fréquences à l'identique de l'original
3) WMA, gardant égalemement un maximum de fréquences à l'identique de l'original, mais coupant net à 14000Hz
4) MP3pro, conservant intégralement les hautes fréquences, mais dans l'ensemble est peu semblable à l'original
5) VQF, conservant aussi les hautes fréquences, mais de façon irrespectueuse par rapport à l'original
6) MP3, conservant quelques traçes au-delà de 16000Hz, sinon tout le reste du signal ne correspond pas à l'original, avec des pics de puissances dans des fréquences totalement délaissés dans l'original.

Attention, il s'agit là d'un classement par rapport au spectre. Voir la suite des tests avant de déçider quel est le "meilleur format mp4".

 


TESTS DE RESTITUTION

 

Les tests de restitution consistent à écouter la musique-témoin via oreille humaine en comparant la version compressé à la version originale. Pour cela, le logiciel MCP lit jusqu'a 3 fois la même musique, et le testeur choisi d'écouter l'une des 3 "sortie audio".

L'écoute s'est faite au moyen du casque stéréo de marque AKG modèle K-271 studio, celui-ci couvrant un large spectre de fréquences audible.

 

WAV

La musique au format original.

 

MP3

L'écoute est très satisfaisante à 128Kbps. Néanmoins le son semble légèrement étouffé, ceci dû à un affaiblissement des hautes fréquences. Notable lorsque des cymbales jouent durant l'écoute.

 

AAC

L'écoute est très satisfaisante à 96Kbps. Les hautes fréquences sont un peu plus forte que dans la musique originale. Cette différence reste discrète, mais a tendance à modifier l'image stéréo du son dans ces même fréquences.

 

OGG

L'écoute est très satisfaisante à 96Kbps. On remarque immédiatement que les hautes fréquences sont plus forte que dans la musique originale, ce qui est irréspectueux envers le son original.

 

WMA

L'écoute est peu satisfaisante à 80Kbps. Les hautes fréquences sont absente, coupant net le jeu des cymbales, le son est nettement moins claire. Certains pic de fréquences sont néanmoins audible, mais sont souvent déformés et ne correspondent plus au son original.

 

VQF

L'écoute est satisfaisante à 80Kbps. Les hautes fréquences sont atténuées, faiblement perceptible. En revanche il y a des pics de hautes fréquences lorsque celles-ci dépassent un seuil donné, ce qui donne globalement une impression de bruits parasite, comparativement au son original. Lorsqu'il n'y a que des fréquences aigues, ce phénomène est moins perceptible.

 

MP3pro

L'écoute est très satisfaisante à 96Kbps. Les hautes fréquences sont très légèrement atténuées, et l'image stéréo est réduite dans ces même fréquences. Plus gênant, on entend de brefs parasites irréguliers lorsque les hautes fréquences sont faible.
En utilisant un lecteur MP3 ne supportant pas le format MP3pro, l'écoute est peu satisfaisante, avec un cruel manque dans les hautes fréquence et quelques déformations du son.

 

En conclusion, en classant dans l'ordre du codec dont la réstitution est statisfaisante :

1) AAC, les différences sont très peu perceptible.
2) OGG, seul l'excès d'aigues est différent de l'original.
3) MP3 (à 128Kbps), les différences sont très peu perceptible, mais le bitrate est considérablement plus élevé que l'AAC (plaçé ici à titre indicatif).
4) MP3pro, quelques parasites discrèts trouble l'oreille attentive, image stéréo aigue un peu réduite.
5) VQF, les hautes fréquences sont atténuées et déformées.
6) MP3 (à 96Kbps), les hautes fréquences sont très atténuées, la musique est amputé de façon claire.
7) WMA, malgré les basses fréquences respecté, l'absence totale de fréquences hautes assourdi le son, et beaucoup de pic de fréquences déformés sont des désagrément supplémentaire à l'écoute. Ces problèmes sont audible non seulement en laboratoire, mais aussi en écoute "standard" sur des hauts-parleurs grand public. On espère que microsoft améliorera la courbe de réponse de son codec lors des futures version (test actuel avec la version 9).

On notera l'excellent résultat du MP3, dont la qualité est vraiment proche de l'original, et ce à 128Kbps. L'absence des très hautes fréquences comme vu sur le test du spectre est quasiment inaudible.

 


Addendum : vitesse d'encodage relative avec chaque codec, du plus rapide au plus lent :
Voici une petite liste mémorisant la vitesse à laquelle se faisait l'encodage de l'extrait musicale utilisé dans ces tests. Par "vitesse originale", on sous-entend la durée totale pour l'écoute de la musique, c'est-à-dire 5 minutes 44 secondes. 2 fois la vitesse originale signifie que la compression a durée environ 2 minutes 50 secondes.

Processeur central cadencé à 1,4GHz

1) MP3, plus de 12 fois la vitesse originale de la musique
2) WMA, environ 10 fois la vitesse originale
3) OGG, 6 fois en moyenne
4) MP3pro, 4 fois la vitesse originale
5) VQF, 3 fois la vitesse originale
6) AAC, 2 fois la vitesse originale

Dans tout les cas (et si l'option était disponible), l'encodage se faisait avec les options de qualité au maximum et avec Join Stereo.

 


NOTE : ces tests ont été réalisé pour le bitrate 96Kbps. Le format AAC aurai le meilleur rapport qualité/respect du son pour ce bitrate. Cela ne conclue pas le débat sur "le meilleur codec MPEG-4". Voir test à 64Kbps.

retour sommaire

Copyright (o) Proger 2003 [email]
Toute reproduction sans notification préalable est proscrite