J'ai des séquences 4K 3840x2160 au format MP4 que je dois ramener à 1080p. J'ai essayé de courir
ffmpeg -i orig.mp4 -vf scale=1920:1080 smaller.mp4
mais le résultat est de très mauvaise qualité, l'image entière étant composée de "tuiles" carrées comme si j'agrandissais 4: 1.
Voici le résultat de l'exécution de cette commande:
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'origs/P1000003.MP4':
Metadata:
major_brand : mp42
minor_version : 1
compatible_brands: mp42avc1
creation_time : 2015-02-19 17:10:38
Duration: 00:05:14.48, start: 0.000000, bitrate: 95903 kb/s
Stream #0.0(und): Video: h264 (High), yuvj420p, 3840x2160 [PAR 1:1 DAR 16:9], 95792 kb/s, 25 fps, 25 tbr, 90k tbn, 50 tbc
Metadata:
creation_time : 2015-02-19 17:10:38
Stream #0.1(und): Audio: aac, 48000 Hz, stereo, s16, 125 kb/s
Metadata:
creation_time : 2015-02-19 17:10:38
Incompatible pixel format 'yuvj420p' for codec 'mpeg4', auto-selecting format 'yuv420p'
[buffer @ 0x22a3420] w:3840 h:2160 pixfmt:yuvj420p
[scale @ 0x22a3ce0] w:3840 h:2160 fmt:yuvj420p -> w:1920 h:1080 fmt:yuv420p flags:0x4
Output #0, mp4, to '1-short.mp4':
Metadata:
major_brand : mp42
minor_version : 1
compatible_brands: mp42avc1
creation_time : 2015-02-19 17:10:38
encoder : Lavf53.21.1
Stream #0.0(und): Video: mpeg4, yuv420p, 1920x1080 [PAR 1:1 DAR 16:9], q=2-31, 200 kb/s, 25 tbn, 25 tbc
Metadata:
creation_time : 2015-02-19 17:10:38
Stream #0.1(und): Audio: libvo_aacenc, 48000 Hz, stereo, s16, 200 kb/s
Metadata:
creation_time : 2015-02-19 17:10:38
Stream mapping:
Stream #0.0 -> #0.0
Stream #0.1 -> #0.1
Press ctrl-c to stop encoding
frame= 125 fps= 6 q=31.0 Lsize= 968kB time=5.00 bitrate=1586.7kbits/s
video:842kB audio:123kB global headers:0kB muxing overhead 0.421047%
Je sais par expérience que ffmpeg est un excellent outil, donc je dois visser les options / paramètres d'une manière ou d'une autre ...
Comment puis-je faire ceci?
-c:a copy
, car vous ne voulez pas ou n'avez pas besoin de ré-encoder le flux audio. Utilisez-le -map 0
pour copier les métadonnées d'un chapitre ou d'autres éléments. (ffmpeg ne prend que 1 vidéo + 1 aud par défaut.)
-sws_flags lanczos+print_info
utilisera un meilleur algo de mise à l'échelle que la valeur par défaut (bilinéaire je pense). La réponse de stlb couvre la partie encodage vidéo du processus.
scale=1920:-2:flags=lanczos
. J'allais également mentionner l' -2
échelle pour dans ma réponse inexistante. Pour ceux qui ne savent pas, vous pouvez mettre -2
en largeur ou en hauteur, et cela fournira automatiquement la valeur correcte tout en préservant le rapport d'aspect et en rendant la valeur divisible par 2 (requis par libx264 pour les sorties yuv420p).
-t 10
pour faire une sortie de 10 secondes. Pourquoi voulez-vous réduire l'échelle? Quel est le cas d'utilisation de votre sortie mise à l'échelle? Ces informations m'aideront à fournir une réponse plus précise.