Splet je že od samih začetkov zamišljen kot zmes besedil, grafike, animacije in zvoka. Tipičen članek ima v zadnjih letih vse manj besed in vse več slik, kar je delno povezano z vse hitrejšim spletom, delno pa seveda z našo ljubeznijo do sličic. Pri tem ne mislim le pohujšljivih vsebin, čeprav seveda prav te pritegnejo ogromno pozonorsti in po svoje silijo znanost k vse boljšim domislicam, ki vodijo v hitrejši in obširnejši promet.
No, mogoče še kratek medklic za tiste z najboljšo pozornostjo. Res je, že osem let je minilo od zadnje objave, kar seveda pomeni, da še vedno migam, vmes pa sem tudi, samo ne tukaj.
Vrnimo se torej k slikam. Ali opazite razliko med naslednjimi dvemi?


Najbrž ne. V obeh primerih gre za sliki v PNG formatu, v obeh primerih za enake dimenzije (640 x 444 pikslov, kar je, roko na srce, kar malce preveč razkošno, ampak naj bo).
Dejansko je edina razlika v zapisu grafike. Zgornja slika ima barve v 24 bitnem zapisu, spodnja pa ima vsak piksel v eni izmed vnaprej določenih 256 barv, kar je seveda prostorsko bistveno manj potratno. Človeško oko razlike načeloma ne opazi. Še posebej, če primerja sliki na hitro, na malce zamaščenem ekranu, medtem, ko z enim očesom še vedno ugotavlja, ali je Messi vendarle osvojil še kakšno manjkajočo lovoriko.
No, za Guglove bote je razlika bistvena. Zgornja slika ima okroglih petsto megabajtov, kar pomeni pol milijona znakov, spodnja pa le 89 kilobajtov, torej zasede le petino prostora zgornje. Ob enakem učinku za uporabnika!
Torej se morajo boti odločiti, katera slika jim je bolj povšeči. Podatki o najdenih objavah na spletu namreč niso zastonj. Ko bot obišče spletno stran, preveri, kaj je na njej in, če oceni (v bistvu to naredi drug bot, a ne bodimo malenkostni), da je stran vsaj malce uporabna, podatke shrani. Seveda je treba podatke razvrstiti, indeksirati in vse skupaj nekam zapisati in vse to stane v času, prostoru in energiji.
Guglovim delničarjem nikakor ni vseeno, kako trošijo svoj čas, prostor in energijo, zato je jasno, da bo bot na vsak način dajal prednost spodnji sliki.
Zgornje pravzaprav sploh ne bo hotel indeksirati. Poskusite sami, če ne verjamete.
Pravzaprav mu je tudi 89 kilobajtov preveč. Kaj menite o tretji in četrti sliki?


Še vedno imamo opravka z isto sliko in z istimi dimenzijami. toda tokrat sta obe zapisani v JPG formatu. Da ne bom preveč pametoval, bom le zapisal, da običajen uporabnik med oobema formatoma loči le, kadar poskuša uporabiti enega ali drugega v posebnih pogojih, ko bi lahko prosojnost PNG formata ali njegova sposobnost nastopanja v več plasteh vplivala na končni rezultat. Kar pomeni, da praktično nikoli.
JPG format je znan predvsem po izjemni sposobnosti kompresiranja (stiskanja) podatkov. To na primer pomeni, da namesto 111111111111 zapiše 12×1. Okej, zelo sem poenostavil, ampak bistvo ste dojeli.
Pri takšni kompresiji se prej ali slej tudi plača neka cena. Ko hočemo sliko prikazati končnemu uporabniku (ne botu), jo je treba nekako odpakirati (napihniti?) in kakšen podatek se lahko tudi izgubi (lahko je na primer kak odtenek modre malce drugačen, kot je bil v izvirniku, ali pa so številke, s katerimi predstavljamo datume tako kockaste, da ne ločimo med peticami, šesticami in osmicami).
Toda Guglu se zdi ta cena sprejemljiva. Predstavljeni sliki v JPG formatu sta bistveno manj potratni. Ena ima 66 kilobajtov, druga (čisto spodaj) pa komaj 41 kilobatov. Razlika med njima je nastala zaradi stopnje kompesije (ena ima 80 in druga 50 odstotno).
Zakaj je to dobro vedeti?
Gugl daje prednost stranem z grafiko, a še bolj so mu všeč strani, ki so hitre. Grafika torej da, a ne prevelika.
Ampak kaj, če uporabnik pričakuje bolj kakovostne slike? Če bi si želel zgornji koledar natisniti in ga prilepiti na steno?
Hja, dobil bi en neuporaben zmazek. Za soliden print bo pač treba malo več pikslov. Recimo 3000 x 2000. To bi pomenilo, da bi imela takšna slika kar nekaj megabajtov in je Gugle zlepa ne bi hotel indeksirati. Smola.
Torej iščemo kompromis. Majcene slike za majcene skopuške bote in ogromne umetnine za zahtevne uporabnike.
Zadevo smo rešili tako, da vsako sliko naredimo v najboljši možni resoluciji, formatirani za končnega uporabnika, in jo nato zmanjšamo na velikost, primerno za splet (torej v praksi nekako na dva odstotka izvirnika). Vsaka od tako zmanjšanih sličic pa je prek linka povezana z notranjo bazo, v kateri čaka bahavi izvirnik. S klikom na majceno sliko na spletu se naloži velika slika, primerna za tisk. To prihrani Guglu veliko časa in denarja, uporabniku predvsem veliko časa in živcev (strani z ogromnimi slikami se zelo počasi nalagajo), lastniku spletne strani, ki ima sicer nekaj dodatnega dela, pa tudi nekaj denarja, saj je njegov promet manj obremenjen. Velike slike se namreč naložijo le tistim uporabnikom, ki na male slikice kliknejo (v praksi je takšnih komaj kak odstotek). Še to nihče ne klikne na vse slike, sploh pa ne naenkrat.
Upam, da sem bil dovolj jasen.
Tule je torej primer spletne strani, na kateri je pravo morje koledarjev za leto 2023. Nekateri med njimi so imeli sprva prek osem megabajtov, sedaj pa na sami spletni strani noben ne dosega niti odstotka te vrednosti. Ko pa ga kliknete … No, kakovost ocenite sami.
Posledično imajo slike dobre možnosti za indeksiranje, uporabniki jih najdejo, z njimi so zadovoljni (no ja, kak odstotek) in delo oblikovalca ni šlo v nič.