Vyhledávání obrázků a fotografií
Červen 17th, 2007 by Jiří Jakl
Obrázek něčeho konkrétního lze dnes na Google dohledat velmi rychle. Najdeme ovšem vždy to co hledáme a není lepší raději hledat cíleně v nějakých spolehlivých zdrojích?
K sepsání tohoto příspěvku mne vedlo slyšení, že na Google údajně první vyhledané obrázky jsou “spolehlivé” a množství chyb v pojmenování obrázků je pak srovnatelné s knižními publikacemi. Vím jak “spolehlivé” jsou některé internetové zdroje v podávání textových informací (autory mnohdy znám osobně), tak jsem se pustil do zkoumání odborného tvrzení pro změnu o obrazových informacích na Internetu. Jde hlavně o to, zda autor fotografii vždy správně pojmenuje a zda jsou jeho stránky dělány tak, aby s vyhledáváním pojmenovaných obrázků nebyly spojeny technické potíže (místo hledané olše najdeme potápníka nebo tu olši snad ani nedohledáme kvůli špatně kódovaným stránkám).
V první řadě jsem nad problematikou jednoduše zauvažoval. Stejně jako knížky jsou dobré i špatné, jsou dobré a špatné weby. Internetové stránky mohou být dělány naprostými amatéry (resp. např. neodborníky na kytky), stačí mít potřebné vybavení (komp a digitál), stránky umět vytvořit a mít prostředky a schopnost je provozovat.
Už tady nezřídka nastává rozkol, že vynikající biolog (člověk schopný bezpečně pojmenovat co chce vystavit na Internet) zdaleka nemusí být schopen stránky vytvářet, spíše se v tomto ohledu dovede prosadit informatik, který rozumí především informatice (jak na své stránky dostat co nejvíce návštěvníků a stránky udělat technicky propracované, vizuálně atraktivní a posléze preferované vyhledávači). Rozdíl je i v motivaci, kdy jeden chrlí věci na Internet třeba jen ze zábavy (s možností bagatelizace a omluvitelnosti špatných popisek a paradoxně zdůrazněním vysoké návštěvnosti) a druhému zase jde o prezentaci defakto své odborné činnosti (s možností ztráty renomé s každou špatnou popiskou - svědčící o předpokladu odvádění další nekvalitní práce spojené přímo s profesionální činností).
Dále pro odborníka (biologa) je obvykle bohužel důležité především chrlit odborné publikace a ne fotky a texty určené k popularizaci pro širokou veřejnost, na druhou stranu amatér dokáže být velmi výkonný v šíření povrchních informací, které mohou zajímat nejvíce lidí a mají tak i nejvyšší návštěvnost. Z logiky pak vychází, že profesionální stránky s někdy i nezáživným či nesrozumitelným textem a menším počtem zpětných odkazů mohou vyhledávače poněkud pomíjet proti stránkám amatérským. A navíc co je důležité z odborného hlediska, nemusí být atraktivní z pohledu prostého člověka, pro kterého jsou např. zajímavé stromy, jejich květy, listí a plody, ale méně třeba už dřevo, kůra nebo pupeny, které tak na Internetu mohou i u běžných dřevin zcela chybět. Lze si pak snad jedině přát spolupráci “biologů” a “informatiků”, neboť jejich konkurence vede jen ke dvěma celkem nepoužitelným liniím webů (charakterizovaných jejich obsahem a provedením).
Zkusme ale výše uvedené tvrzení o použitelnosti vyhledávačů ověřit v praxi. Do vyhledávání obrázků na Google (stejně i v dalších následujících případech vyhledávání, dobou vyhledávání je konec roku 2006) zadejme “olše lepkavá” (český název se bude vyhledávat především na nám dobře hodnotitelných českých stránkách). Vyjíždí nám 33 nálezů, kdy po letmém prohlídnutí přehledů v 9ti případech není zobrazen náhled olše lepkavé (jen fotografie parku, jednou dokonce ocún, kůra jiných dřevin ovšem na dané stránce správně popsaných komentářem v textu), další nález nelze ověřit (je z již neexistující stránky s nezřetelným náhledem na asi lesní školku) a další dva obrázky se vztahují ke kultivarům. Velikost obrázků je samozřejmě různá a mezi obrázky nalezneme jak dva kvalitní scany ilustrací všech orgánů (možná bez svolení autora s tímto použitím), tak jenom třeba fotografie šištiček. Mezi nalezenými obrázky se pak osm opakuje dvakrát (jsou jen různě velké a z toho tatáž ilustrace se jednou opakuje na dvou různých serverech). Z popsaného výsledku (byť nejde o rozsáhlejší analýzu) bych si tedy dovolil udělat závěr, že pokud hledáme velmi rychle a dokonce třeba ani nevíme co hledáme, můžeme si stáhnout i nesmysly. Zmíněné nesmysly bychom ale ve větším množství smysluplnějších jiných obrázků měli být schopni odhalit, totéž platí i o podrobnějším zkoumání stránek odkud stahujeme (ověření, zda stahovaná fotka je skutečně okomentována patřičným jménem a nepatří na stránce k něčemu jinému).
A jaké že stránky nám to vyjely? Komerční o tinkturách, wikipediové, firemní dřevařské, stránky neprofesionálního botanika, zámecké, ubytovny, městské, pak teprve stránky dendrologa (Mojžíšek), následují stránky žáka 9. třídy… obrázek z jediné vědecké instituce (pražské lesnické fakulty) nabídku uzavírá a zcela ukončuje pak náhled na obrázek z již neexistující stránky. Nutno poznamenat, že olše lepkavá je dobře poznatelný druh. V případě hledání méně významné “olše zelená” nám nabíhají ukázky jen ozeleněného dřeva obyčejné olše, vtipně vypadá náhled na potápníka. Olše zelená je ovšem někdy řazena do rodu “olšička” (pak vyjíždí skutečně seriózně olšička - konkrétně semena v databázi zmíněné lesnické fakulty, ale nic více) či “křestice” (v náhledu je pak skřivan a ocún, ale obrázek nikde, snad jen stopa po mém článku věnovaném olším na Příroda.cz, což je ale spíše amatérský web). U hůře rozlišitelných druhů jako třeba fialovokvětých v rodu “violka” autoři fotografií ledacos nazvou druhovým jménem nejznámějšího zástupce “violka vonná”, nepochybně přitom na jejich fotografii najdeme jiné druhy (Rivinovu, lesní, psí aj.), protože na co si mnohdy netroufne odborník, s tím v nevědomosti nemá problém amatér. Se směsí nesmyslů tu prostě musíme počítat. Naproti tomu když hledáte v nějakém osvědčeném zdroji, nakonec může být i vaše hledání rychlejší, protože se nemusíte probírat kupou nesmyslů.
V souvislosti s hledáním např. “Magnolia obovata” lze zase narazit na tvrzení, že “Japonci to na svých stránkách mají určitě dobře”. Řekl bych ale, že Japonci jsou stejně jako my jen chybující lidé, takže pokud zmíněný druh není jejich jediný původní druh nefocený z parků, nelze ani výše uvedené tvrzení považovat za relevantní (a tím spíše, pokud jde o neodborné stránky). Určitě bych tedy bez uvedení zdroje obrázkům vyhledaným jen Googlem příliš nedůvěřoval. Navíc určitá podobnost jevu tu může být jako u hledání výrazu se špatným i/y na národních stránkách (na Seznamu najdete vedle “blýskání” i “blýskání”, i když s menším počtem nálezů). Ani příslušníci jistého národa za každých okolností totiž vždy nevědí, jak co psát nebo jak třeba vypadá jeden druh jejich magnolie.
Vedle fotografií může Google nalézt i pérovky z tištěných publikací. Na pérovkách bývají uváděna jména taxonů přímo, jejich pořízení není zrovna jednoduché a byť jde asi obvykle o pérovky defakto nezákonným způsobem zpřístupněné, určitou vyšší míru správnosti určení zde předpokládat lze (když už si někdo dal práci s kresbou, tak si asi dal i tu práci s určením nebo práci zadal některý biolog na korektnost dohlížející).
Google má tedy myslím cenu jen v rukách odborníka, který ví předem jak má něco vypadat a jen to potřebuje do ruky. Vzdělávat se prostým vyhledáváním na Internetu s využitím vyhledávačů ale spíše nejde. Ono stačí vyhledávat i obecné slovo jako “computer” a moc počítačů taky nevyjede. A zkuste vygooglovat vlastní jméno - to se asi podivíte, jak to vlastně vypadáte a v souvislosti s jakými obrázky figuruje vaše jméno. Nakonec je tu i záznam rozhovoru s Ondřejem Zichou z Biolib.cz, proč Google vyhledává tak jak vyhledává -zde-.
81ePosted in Botanopolitan |