Quels paramètres utiliser lors de la création de fichiers 7zip afin d'obtenir une compression maximale lors de la compression de PDF?


15

Quels paramètres utiliser lors de la création de fichiers 7zip afin d'obtenir une compression maximale? Je compresse des documents PDF contenant des images numérisées. Je pense à utiliser LZMA2, mais je ne sais pas quoi définir dans la taille du dictionnaire, la taille des mots, etc. De plus, LZMA ou PPMd seraient-ils de meilleures options?

J'ai besoin de transférer des fichiers (~ 200 Mo) sur le net et les vitesses de téléchargement sont très lentes, donc je voudrais compresser les données autant que possible. Le temps CPU consommé n'est pas très important.

ÉDITER

Voici ce que j'ai obtenu après avoir testé différentes méthodes de compression:

La taille non compressée était de: 25,462,686B

Mon processeur est Intel Core 2 Due T8100 et j'ai 4 Go de RAM.

La meilleure compression était avec PeaZip en utilisant l'algorithme PAQ8O. La taille du fichier résultant était 19,994,325B. Les paramètres utilisés étaient le niveau de compression: maximum. Malheureusement, la vitesse de compression était d'environ 5 Ko / s, il a donc fallu plus d'une heure pour compresser les données.

Vient ensuite le compresseur expérimental PAQ9O. En l'utilisant, j'ai obtenu 20.132.660B en environ 3 minutes de compression. Malheureusement, le programme est uniquement en ligne de commande, et peu d'autres programmes utilisent cet algorithme de compression. Il utilise également environ 1,5 Go de RAM avec les paramètres que j'ai utilisés (a -9 -c)

Après cela, 7-Zip 9.15 beta (2010-06-20) utilisant LZMA2. En l'utilisant, j'ai obtenu 20 518 802 B en environ 3 minutes. Les paramètres utilisés étaient la taille des mots 273, la taille du dictionnaire 64 Mo et j'ai utilisé 2 threads pour la compression.

Revenons maintenant à ma question d'origine: dans mon cas, la taille du bloc solide n'a produit aucun résultat notable. L'augmentation de la taille des mots a produit certains résultats. La différence entre la taille de mot la plus élevée et la plus petite était de 115 260B. Je pense que ces économies justifient les efforts nécessaires pour effectuer deux clics nécessaires et changer la taille des mots.

J'ai essayé d'utiliser d'autres algorithmes de compression pris en charge par 7zip et PeaZip et ils produisent des fichiers de 19,8 Mo à 21,5 Mo.

Au final, ma conclusion est que lors de la compression de documents PDF contenant principalement des images, l'effort nécessaire pour utiliser des algorithmes de compression exotiques n'est pas justifié. La compression utilisant LZMA2 dans 7zip a produit des résultats tout à fait acceptables en un minimum de temps.


Quelle est la différence avec PeaZip? C'est juste un wrapper GUI autour de 7zip et de nombreux autres outils
Cole Johnson

@Cole "Cole9" Johnson Eh bien, la différence est que dans mon cas, j'ai utilisé des "autres" outils de PeaZip qui n'avaient pas d'interface graphique à l'époque. Si je me souviens bien, seul PeaZip proposait l'algorithme PAQ8O avec une interface graphique.
AndrejaKo

Réponses:


7

Le contenu des fichiers PDF (texte et images) est probablement déjà compressé - il n'y aura donc pas grand-chose à gagner en essayant de les compresser à nouveau.


3
Et bien non. J'ai fait un peu de test et pris 24 Mo de PDF et les ai compressés en utilisant les paramètres par défaut. Le résultat était un fichier de 19 Mio. Dans mon cas, ces 5 Mio importent dans mon cas.
AndrejaKo

1
On dirait que tu as raison. Je ne pouvais pas produire de résultats significativement meilleurs que les valeurs par défaut de 7zip, quoi que je fasse. Je suis toujours convaincu qu'une certaine compression est meilleure qu'aucune.
AndrejaKo

3
Si vous pouviez économiser autant d'espace, alors il y a probablement du travail qui pourrait être fait avec les PDF eux-mêmes pour économiser presque tout cet espace sans 7-Zip. Un voyage à travers PDF Optimizer d'Acrobat peut faire des merveilles.
afrazier

Voir la réponse de usr - la compression utilisée en PDF (zlib) peut être inversée pour les compresser davantage (et à nouveau appliquée lors de la reconstruction). Cela se traduit souvent par une réduction de taille de ~ 50%
schnaader

@schnaader: C'est vraiment intéressant. J'ai vu et utilisé des outils comme Acrobat's PDF Optimizer et MuPDF pour modifier les PDF tout en les gardant visibles, mais être capable de les transformer sans perte comme ça est également très précieux et peut être utilisé avec grand avantage.
afrazier

8

Essayez la précompression - elle décompresse d'abord les données déjà compressées à l'intérieur de vos PDF. Ensuite, 7z peut faire sa magie sur des données non compressées.

Essayez également le nanozip que j'ai vérifié comme étant très efficace, mais très efficace (400kb / s aux taux de compression des algorithmes PAQ).


2

7za a -t7z -mx-9 -mfb = 258 -mpass = 15 nom de fichier sous-répertoire 7z

Ajustez le premier mot si nécessaire pour le nom de votre exécutable de ligne de commande et ajustez les parties après "-mpass = 15" pour personnaliser votre nom de fichier et ce qu'il doit inclure.

Cette réponse n'est pas spécifique aux documents PDF.
Cela utilise LZMA, pas PPM. Je suis resté loin de PPM car il y a trop de variantes qui ne sont pas compatibles avec d'autres variantes. LZMA semble être plus stable, la compatibilité étant plus largement prise en charge. Je me suis donc éloigné de PPM précisément parce que mon opinion était, comme vous l'avez dit, "l'effort nécessaire pour utiliser des algorithmes de compression exotiques n'est pas justifié".


2
LZMA2 est nettement meilleur que LZMA mais est destiné à une utilisation (efficace) uniquement sur les systèmes 64 bits.
OMY

-3

La compression lzma est la meilleure car vous pouvez créer un fichier sfx ou un package msi avec un taux de compression élevé. dans votre cas vous ne compressez pas un gros fichier donc la différence est assez petite surtout si le fichier a été compressé tel que: mp3 ou png

essayez de gagner l'arc c'est gratuit et donne un taux de compression gret

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.