Vés al contingut

AV1

De la Viquipèdia, l'enciclopèdia lliure
Infotaula de format de fitxerAV1
TipusFormat de codificació de vídeoiespecificacióModifica el valor a Wikidata
MIMEvideo/AV1ivideo/webm; codecs= "av01.*"Modifica el valor a Wikidata
DesenvolupadorAlliance for Open MediaModifica el valor a Wikidata
Versió inicial28 març 2018Modifica el valor a Wikidata
Extensió deVP9,Daala(en)TradueixiThor(en)TradueixModifica el valor a Wikidata
EstàndardAV1 Bitstream & Decoding Process Specification(en)TradueixModifica el valor a Wikidata
Més informació
Wiki del format de fitxerAV1Modifica el valor a Wikidata
Lloc webaomedia.org…Modifica el valor a Wikidata

AOMedia Video 1(AV1) és unformat de codificació de vídeoobertilliure de drets d'autordissenyat inicialment per a transmissions de vídeo a través d'Internet. Va ser desenvolupat com a successor deVP9per l'Alliance for Open Media(AOMedia), un consorci fundat el 2015 que inclou empreses desemiconductors,proveïdors devídeo sota demanda,productors de contingut de vídeo, empreses de desenvolupament de programari i proveïdors de navegadors web. L'especificació de flux de bits AV1 inclou uncòdec de vídeode referència.El 2018,Facebookva realitzar proves que s'aproximaven a les condicions del món real i el codificador de referència AV1 va aconseguiruna compressió de dadesun 34%, un 46,2% i un 50,3% més alta que libvpx-vp9,x264High profile i x264 Main profile respectivament.[1]

Igual que VP9, però a diferència deH.264(AVC) iH.265(HEVC), AV1 té un model de llicència lliure de drets d'autor que nodificulta l'adopció en projectes de codi obert.

AVIFés unformat de fitxer d'imatgeque utilitza algorismes de compressió AV1.

Història

[modifica]

Les motivacions de l'Aliança per crear AV1 incloïen l'alt cost i la incertesa que comporta la llicència de patents d'HEVC,el còdec dissenyat perMPEGque s'espera que succeeixia AVC.A més, els set membres fundadors de l'Aliança (Amazon,Cisco,Google,Intel,Microsoft,MozillaiNetflix) van anunciar que l'enfocament inicial del format de vídeo seria el lliurament de vídeo web d'alta qualitat. L'anunci oficial d'AV1 va arribar amb el comunicat de premsa sobre la formació de l'Alliance for Open Medial'1 de setembre de 2015. Només 42 dies abans, el 21 de juliol de 2015, es va anunciar que l'oferta de llicència inicial d'HEVC Advance suposava un augment de les tarifes de drets d'autor del seu predecessor, AVC. A més de l'augment del cost, la complexitat del procés de llicència va augmentar amb HEVC. A diferència dels estàndards MPEG anteriors on la tecnologia de l'estàndard es podia llicenciar d'una sola entitat,MPEG LA,quan es va acabar l'estàndard HEVC, s'havien format dosgrups de patentsamb un tercer grup a l'horitzó. A més, diversos titulars de patents es negaven a llicenciar patents a través de qualsevol grup, augmentant la incertesa sobre les llicències d'HEVC. Segons Ian LeGrow de Microsoft, es va considerar que una tecnologia de codi obert i lliure de drets d'autor era la manera més senzilla d'eliminar aquesta incertesa sobre les llicències.

Propòsit

[modifica]

AV1 pretén ser un format de vídeo per a la web que sigui alhorad'última generacióilliure de drets d'autor.Segons Matt Frost, cap d'estratègia i associacions de l'equip de Chrome Media de Google, "La missió de l'Alliance for Open Media segueix sent la mateixa que el projecteWebM".Una preocupació recurrent en el desenvolupament d'estàndards, sobretot dels formats multimèdia lliures de drets d'autor, és el perill d'infringir accidentalment patents que els seus creadors i usuaris no coneixien. Aquesta preocupació s'ha plantejat pel que fa a AV1, i anteriormentVP8,VP9, Theora iIVC.El problema no és exclusiu dels formats lliures de drets d'autor, però amenaça exclusivament el seuestatde lliures de drets d'autor.

Llicència de patents AV1,VP9,Theora,Perfil base MPEG-5 VVC,HEVC,AVC,MPEG-5 Perfil principal GIF,MP3,MPEG-1,MPEG-2,MPEG-4 Part 2
Per titulars de patents coneguts Les patents han caducat Amb participació de guanys Les patents han caducat
Per titulars de patents desconeguts Impossible de determinar fins que el format sigui prou antic com per haver caducat qualsevol patent (almenys 20 anys alspaïsos de l'OMC)

Tecnologia

[modifica]
Etapes de processament d'un codificador AV1 amb tecnologies rellevants associades a cada etapa

AV1 és un format tradicional detransformació de freqüènciabasat en blocs que inclou noves tècniques. Basat en el VP9 de Google, AV1 incorpora tècniques addicionals que ofereixen principalment als codificadors més opcions de codificació per permetre una millor adaptació a diferents tipus d'entrada.

L'Aliança libaom va publicar unaimplementació de referènciaescrita enCillenguatge ensamblador(aomenc,aomdec) com aprogramari lliuresota els termes de lallicència de 2 clàusules BSD.El desenvolupament es fa en públic i està obert a les contribucions, independentment de la pertinença a l'AOM. El procés de desenvolupament va ser tal que es van afegir eines de codificació a la base de codi de referència com aexperiments,controlats per senyals que les habiliten o desactiven en temps de creació, per a la revisió d'altres membres del grup, així com d'equips especialitzats que van ajudar i garantir la compatibilitat i el compliment del maquinari. amb drets de propietat intel·lectual (TAPAS).

10 maneres de subparticionar unitats de codificació: en quadrats (recursivament), rectangles o mescles d'aquests ( "en forma de T" )

Particions

[modifica]

El contingut del marc es divideix en blocs adjacents de la mateixa mida anomenats superblocs. Similar al concepte demacrobloc,els superblocs tenen forma quadrada i poden tenir una mida de 128×128 o 64×64 píxels. Els superblocs es poden dividir en blocs més petits segons diferents patrons de partició. El patró de divisió de quatre vies és l'únic patró les particions del qual es poden subdividir recursivament. Això permet que els superblocs es divideixin en particions tan petites com 4 × 4 píxels.

Esquema de la partició del superbloc AV1. Mostra com els superblocs de 128 × 128 es poden dividir fins a blocs de 4 × 4. Com a casos especials, els blocs de 128×128 i 8×8 no poden utilitzar divisions 1:4 i 4:1, i els blocs 8×8 no poden utilitzar divisions en forma de "T".

S'introdueixen els patrons de partició "en forma de T", una característica desenvolupada per a VP10, així com les divisions horitzontals o verticals en quatre franges de proporció d'aspecte 4:1 i 1:4. Els patrons de partició disponibles varien segons la mida del bloc, tant els blocs 128×128 com els 8×8 no poden utilitzar divisions 4:1 i 1:4. A més, els blocs de 8 × 8 no poden utilitzar divisions en forma de "T".

Ara es poden utilitzar dues prediccions separades en parts espacialment diferents d'un bloc mitjançant una línia de transició suau i obliqua (predicció dividida en falques). Això permet una separació més precisa dels objectes sense les línies tradicionals d'escales al llarg dels límits dels blocs quadrats.

És possible més paral·lelisme del codificador gràcies a la dependència de predicció configurable entre les files de mosaic (ext_tile).

Predicció

[modifica]

L'AV1 realitza un processament intern amb una precisió més alta (10 o 12 bits per mostra), cosa que condueix a una millora de la qualitat reduint els errors d'arrodoniment.

Les prediccions es poden combinar de maneres més avançades (que una mitjana uniforme) en un bloc (predicció composta,incloent gradients de transició suaus i nítids en diferents direccions (predicció dividida en falques), així com màscares implícites que es basen en la diferència entre els dos predictors. Això permet la combinació de dues prediccions inter o una predicció inter i una intra al mateix bloc.

Transformació de dades

[modifica]

Per transformar l'error restant després de la predicció al domini de freqüència, els codificadors AV1 poden utilitzarDCTrectangulars quadrats, 2:1/1:2 i 4:1/1:4 (rect_tx), així com un asimètricDSTper als blocs on s'espera que la vora superior i/o esquerra tingui un error més baix gràcies a la predicció dels píxels propers, o opteu per no fer cap transformació (transformació d'identitat).

Pot combinar dues transformacions unidimensionals per utilitzar diferents transformacions per a la dimensió horitzontal i vertical (ext_tx).

Quantització

[modifica]

AV1 té noves matrius de quantització optimitzades (aom_qm).[2]Els vuit conjunts de paràmetres de quantificació que es poden seleccionar i senyalitzar per a cada fotograma ara tenen paràmetres individuals per als dos plans de croma i poden utilitzar la predicció espacial. A cada superbloc nou, els paràmetres de quantificació es poden ajustar indicant un desplaçament.

Filtres

[modifica]

El filtratge en bucle combina el filtre de pas baix restringit de Thor i el filtre de deringing direccional de Daala alfiltre de millora direccional restringit,cdef.Es tracta d'un filtre de substitució condicional dirigit a la vora que suavitza els blocs aproximadament al llarg de la direcció de la vora dominant per eliminarels artefactes de timbre.[3]

Perfils i nivells

[modifica]

AV1 defineix tres perfils per als descodificadors que sónPrincipal,AltiProfessional.El perfil principal permet una profunditat de bits de 8 o 10 bits per mostra ambmostreig de croma4:0:0 (escala de grisos) i 4:2:0 (quart). El perfil alt afegeix suport per al mostreig de croma 4:4:4 (sense submostreig). El perfil Professional amplia les capacitats fins a un suport total per al submostreig de croma 4:0:0, 4:2:0, 4:2:2 (meitat) i 4:4:4 amb profunditats de color de 8, 10 i 12 bits.

AV1 defineix nivells per als descodificadors amb variables màximes per a nivells que oscil·len entre 2,0 i 6,3.[4]Els nivells que es poden implementar depenen de la capacitat del maquinari.

Les resolucions d'exemple serien 426×240@30fps per al nivell 2.0, 854×480@30fps per al nivell 3.0, 1920×1080@30fps per al nivell 4.0, 3840×2160@60fps per al nivell 5.1, 3840×2160@120fps per al nivell 5.2 i 7680×4320@120fps per al nivell 6.2. El nivell 7 encara no s'ha definit.[5]

Referències

[modifica]
  1. «AV1 beats x264 and libvpx-vp9 in practical use case» (en anglès americà).Facebook Engineering,10-04-2018. Arxivat de l'originalel 5 novembre 2019. [Consulta: 16 juliol 2020].
  2. «av1/encoder/av1_quantize.c - aom - Git at Google» (en anglès).aomedia.googlesource.com.Arxivat de l'originalel 12 setembre 2021. [Consulta: 12 setembre 2021].
  3. Christopher MontgomeryThe Constrained Directional Enhancement Filter» (en anglès).Mozilla Hacks,28-07-2018. [Consulta: 5 gener 2022].
  4. «Annex A: Profiles and Levels» (en anglès).Alliance for Open Media.Arxivat de l'originalel 17 març 2021. [Consulta: 25 març 2021].
  5. «GitHub: AV1 Profiles and Levels» (en anglès). Arxivat de l'originalel 1 febrer 2018. [Consulta: 13 febrer 2018].