Téma měsíce: I z rozmazaných fotografií lze udělat kvalitní snímek

fuze_obrazu3a.gif

Bezpečnostní kamera v bance zachytila tvář lupiče. Tři snímky ale mají nízké rozlišení a jsou rozmazané. Dříve by takové snímky měly mizivou výpovědní hodnotu. Dnes už policejní specialisté vědí, že se nabízí řešení. Tím je metoda rozpoznávání objektů pomocí fúze obrazů. Zvolený příklad je samozřejmě jen jednou z ukázek možného využití metody, kterou vypracoval tým profesora Jana Flussera z Ústavu teorie informace a automatizace Akademie věd. Už dosavadní výsledky vědeckého výzkumu vyvolaly velký mezinárodní ohlas. Tým za ně získal také letošní Cenu Akademie věd ČR a Cenu předsedy Grantové agentury ČR.

Fúzují podniky, banky a také obrazy. Jde o nový, perspektivní směr oboru "počítačové zpracování obrazu". Jak říká profesor Jan Flusser, vyhodnocení a porozumění obrazu pomocí počítače je fascinující obor na pomezí umělé inteligence, informatiky a matematiky. Laicky řečeno, fúzování obrazu znamená slučování obrázků třeba z různých zdrojů, z různých poloh nebo pořízených v různém čase tak, aby byl získán obraz s požadovanou vyšší kvalitou informace.

"Máme několik obrázků. Každý z těch obrázků nese nějakou jinou část informace. Je zde třeba obrázek z infrakamery a zároveň z viditelného spektra. A teď je chceme dát dohromady tak, aby uživatel viděl na jediném obrázku přesně to, co ho zajímá. My jsme tento přístup použili k tomu, abychom zvyšovali rozlišení těch obrázků. Děláme to tedy tak, že máme několik obrázků vyfotografovaných rychle za sebou a zkombinujeme je do jednoho, který má větší rozlišení, než je dokonce fyzické rozlišení kamery, kterou se to pořídilo."

Několikanásobně se tedy zvýší informační hodnota snímku a tím i úspěšnost rozpoznávání určitého objektu. Pokud bychom se vrátili k příkladu bankovního lupiče, znamená to, že výsledný snímek nebude tolik rozmazaný a zároveň bude mít větší rozlišení. S podobnými pokusy se ve světě začalo už asi před pěti lety. To originální, co přinesli čeští vědci, je právě zdokonalený matematický nástroj, který umožňuje požadované zpracování obrazu zcela ´naslepo´ bez znalostí parametrů kamery a dalších údajů o scéně.

Jan Flusser, foto: autor

"Je potřeba řešit soustavu integrálních rovnic, kde neznámé jsou ten ideální obrázek, který bychom chtěli získat, a všechny parametry poškození. Známé jsou ty špatné rozmazané obrázky, které jsme nasnímali. My jsme to formulovali tak, že jsme řešení těch rovnic převedli na řešení jiné ekvivalentní úlohy, na hledání minima jisté složité funkce. A v tom minimu leží právě ten dokonalý ideální obrázek."

Původní teoretické výsledky dotáhl tým profesora Jana Flussera až do podoby uživatelského softwaru.

"Abychom dali možnost jiným lidem a pracovištím si to nejen vyzkoušet, ale i používat, vyvinuli jsme software, který je zpracován ve formě toolboxu pro Matlab. Každý uživatel, který nám napíše a potvrdí nám, že to nebude používat pro komerční účely, ho dostane zadarmo. Je to uživatelsky orientovaný systém, který si každý, kdo používá Matlab, může nainstalovat. Je velmi jednoduché s ním pracovat. V současné době evidujeme již několik set uživatelů z celého světa, především z univerzit."

Základní výzkum všude na světě je hodnocen podle toho, v jak prestižním časopise se podaří výsledky výzkumu publikovat a kolika citací se pak článek dočká v odborném tisku.

"My jsme to publikovali v několika článcích v nejlepších časopisech z oboru zpracování obrazu, které ve světě vycházejí. A jaký to vyvolalo ohlas? Tohle se dá samozřejmě říci jenom o pracích, od jejichž publikování uběhla nějaká doba. Jenom pro ilustraci. Jedna z našich prvních prací na toto téma z roku 2003 má dnes už asi 400 citací, což je v našem oboru velmi vysoké číslo. Opravdu to vyvolalo docela slušný ohlas v mezinárodní vědecké komunitě. My jsme díky tomu dostali třeba různá pozvání jako zvaní řečníci na specializované konference nebo pozvání k napsání kapitol do knížek, čehož si samozřejmě velmi ceníme. To si v mezinárodní komunitě jinak nezařídíte než tím, že máte nějaké dobré výsledky. Tam nefunguje něco za peníze nebo ze známosti. To se nedá obejít. A je to většinou velmi spolehlivý indikátor toho, jestli to, co děláte, je dobře přijímáno nebo to zapadlo bez zájmu."

Tým profesora Jana Flussera už ale myslí na ještě pokročilejší metody fúzování obrazu.

"To, co chceme dělat, na čem už začínáme pracovat, je vymyslet fúzovací metody na zvyšování rozlišení pro normální video sekvence, kde je třeba několik pohybujících se objektů. Každý objekt se hýbe jiným směrem, je tam třeba statické pozadí, takže před tím musíte oddělit pohybující se objekty každý zvlášť. Musí tam předcházet nějaké detekce a segmentace pohybu. A je zde ještě další směr. Až doposud jsme pracovali s modelem, kdy ta scéna nemá v podstatě žádnou hloubku, je rovná. Teď to rozšiřujeme na situace, kdy jsou to obrázky třírozměrných scén, kdy některé objekty jsou velmi blízko kameře a některé naopak jsou velmi daleko, takže ta hloubka se nedá zanedbat a míra rozmazání se pak výrazně mění. Máme už docela dobrou teoretickou představu, jakým směrem jít."

Matematický nástroj vyvinutý českými vědci dokáže zatím z několika, někdy třeba jen ze dvou, nekvalitních fotografií vytvořit jednu téměř perfektní. Jak už bylo řečeno, nová metoda nabízí hodně možností praktického využití, od běžné ´spotřební´ fotografie přes monitorovací a bezpečnostní systémy, policejní praxi až třeba po medicínu, astronomii a restaurování uměleckých děl. Se softwarem z Ústavu teorie informace a automatizace už pracuje řada zahraničních univerzit. V současné době ji testuje i jeden přední světový výrobce mobilních telefonů.

Foto: www.imagefusion.org