Poche righe per fare chiarezza sul significato di sigle relative al campionamento colore come 4:4:4, 4:2:2, 4:2:0 etc, perché vedo che qualcuno non ha ancora chiaro cosa significano e questo rende incomprensibili alcune affermazioni fatte da altre parti su questo blog.
Naturalmente, c’è un ottima spiegazione su wikipedia, ma cercherò di spiegare in modo semplice e senza grafici e diagrammi.

Per farla breve: se noi prendiamo ad esempio un fotogramma di QUALUNQUE DIMENSIONE dovremmo sapere che questo è composto da X pixel verdi, x pixel rossi, x pixel blu su ognuna delle y righe che lo compongono.
Per fare un esempio “standard”, se abbiamo una fotografia in photoshop di 1920 X 1080 pixel, ovvero la risoluzione standard di un fotogramma HD progressivo, noi dovremmo avere 1920 pixel verdi, 1920 pixel rossi e 1920 pixel blu su ognuna delle 1080 righe. Fino a qui è semplice da capire.
Ora però se noi ragioniamo in video, le cose si complicano un po’. Di per se, non sono complicate, ma un po’ per un problema legato alla compatibilità “antica” con il bianco e nero, un po’ perché l’occhio è più sensibile alle variazioni di luminanza (ovvero di intensità luminosa pura) rispetto alla crominanza (ovvero alla variazione di colore da un pixel all’altro), in video si è inventato un modo per ridurre l’occupazione di spazio dividendo i canali, invece che in RGB, in YUV (o meglio bisognerebbe dire YCbCr ma non facciamo i sofisti). Cosa sono questi YUV? La Y è appunto la luminanza, le componenti U e V sono in pratica le componenti colore del rosso e del blu ottenute con una operazione matematica che purtroppo non posso esimermi dallo scrivere, ma lo farò semplificando un po’ (tanto il concetto rimane).
Ovvero:

la Y è ricavata da R+G+B
la U è ricavata da R-Y
la V è ricavata da B-Y

Le formule sopra NON SONO quelle giuste, ma servono a capire il concetto. Nella realtà esiste una correzione del gamma che rende le formule più ostiche da capire, ma per non farmi accusare di dare informazioni sbagliate, ecco anche la formuletta giusta che può però essere saltata da chi non ha voglia di capire la matematica:

Y’ = Kr * R’ + (1 – Kr – Kb) * G’ + Kb * B’
Pb = 0.5 * (B’ – Y’) / (1 – Kb)
Pr = 0.5 * (R’ – Y’) / (1 – Kr)

In questo modo, con altrettante operazioni matematiche al contrario si può ricavare di nuovo il nostro RGB, che è quello che poi fanno player, decoder, televisori ecc ecc.

Se i nostri pixel R G B detti prima li registriamo tutti, solo con l’operazione matematica in questione, avremo il campionamento 4:4:4.

In pratica, 4:4:4 significa tutti i pixel saranno registrati. Perché il 4 rappresenta il “tutti i pixel”: in genere, per standard si prende in considerazione un blocchetto di pixel di 4 pixel orizzontali e 2 verticali…
Per essere più precisi, il primo 4 rappresenta i pixel registrati per il canale Y, mentre i seguenti numeri rappresentano i pixel registrati per i canali U e V sulla prima e sulla seconda riga del nostro blocchetto di 4 X 2 pixel.
Quindi, 4:4:4 vuol dire che la luminanza è registrata con 4 pixel su 4 (quindi tutti) la U e la V sono registrati 4 pixel su 4 sia sulla prima che sulla seconda riga.
Notiamo bene che quasi sempre il primo numero è un 4, questo perché la luminanza è sempre o quasi registrata alla sua piena risoluzione per quanto detto prima, ovvero che l’occhio è più sensibile alle variazioni di luminanza. Fa eccezione solo l’HDCAM che è un 3:1:1 e vediamo poi cosa significa.

Continuando con gli esempi diffusi, il 4:2:2 significa che la luminanza ha i suoi 4 pixel, ma la crominanza ne avrà solo 2 per ogni riga. Ovvero, la risoluzione verticale della crominanza è intonsa, ma quella orizzontale è dimezzata. Come dire che la nostra immagine sarà costituita, nell’esempio sopra, da una Y a 1920 X 1080, ma da U e V con risoluzione 960 X 1080.

Altro esempio diffuso è il 4:2:0 dove in pratica, la luminanza ormai abbiamo capito che ha i suoi 4 pixel, la crominanza sulla prima riga ne ha 2 (la metà), sulla seconda riga ne ha zero, ovvero non si campiona la seconda riga. Che in parole povere significa che ogni due righe ne teniamo una sola, ovvero che la risoluzione è dimezzata anche in verticale.
In pratica, avremo U e V con risoluzione 960 X 540.
Questo sopra spiega anche perché, se fatto in modo opportuno, lo scale di un 4K 4:2:0 a 2K ottiene un 4:4:4: infatti, a 4K avremo (ad esempio) 3860 pixel X 2160 per la luminanza, ma solo 1920 X 1080 per la crominanza. Ma se scaliamo SOLO la luminanza, avremo i tre canali uguali a 1920 X 1080, che è il 4:4:4 del primo esempio.

Chiudo con la spiegazione dell’HDCAM che è un 3:1:1: praticamente, anche la luminanza viene ridotta di un terzo, perché ogni 4 pixel ne avremo solo 3. In soldoni, la risoluzione orizzontale viene ridotta da 1920 A 1440. Sulla crominanza U e V invece avremo 1 solo pixel in orizzontale ogni 4, mentre avremo tutte le righe, in pratica una risoluzione U e V di 480 X 1080, che è una cosa strana ma ditelo alla SONY…

6 Commenti
  1. Ciao Wiliam, complimenti per il blog…non ho capito perchè se scali da 4k a 2k avremo un 1080 HD 4:4:4, ma è una cosa fattibile? Come e con quali software è possibile farlo?
    Grazie e complimenti ancora.

    Maurizio

    • Se scali da in 4K 4.2.0 in 2K ottieni un 444 per la banale ragione che in 420 i piani colore hanno una risoluzione dimezzata rispetto al 4K, ma esatta rispetto al 2K, e quindi in 444. Per fare questa operazione si può usare anche after effect, ma la cosa migliore è utilizzare un programma che si chiama v6 di hdcinematics che ha cura di scalare solo la Y senza toccare le componenti colore.

      • Grazie per la risposta…quindi devo ridurre il file finale in 2K?

        • Beh, ovvio. O meglio, devi ridurlo esattamente alla metà, se è UHD lo porti in HD, se è 4K a 2K.

          • Capisco che per te sono domande inutili e stupide… ma per me sono molto importanti, grazie al tuo blog, ho scoperto un nuovo mondo… 🙂 Una domanda stupida, ma posso ridurre semplicemente con Premiere lavorando con una sequenza in 1080P un file 4K(adattato all’interno della timeline in 1080) ottenendo il 4:4:4???

            Grazie ancora.

            P.S se non ti va di rispondermi capisco, ma non voglio fare errori. 🙂

          • Puoi, ma non sapendo esattamente come scala premiere non posso garantire con certezza che ottieni in vero e proprio 444.di certo ti avvicini molto, io stesso spesso faccio così, anche perché il 444 è importante solo se devi fare un chroma key o cose simili. Per una normale color influisce molto di più il numero di bit.

Lascia un commento