Blog o fotografii w kontekście internetu i tych nowszych mediów. Fotografią zajmuję się od wczoraj i do jutra nie powinno się to zmienić
A.Lucis
Aleksander Lucis
rss archiwum Mobile blip 24foto Goldenline

Wywiad z Tomkiem Korzeniowskim - współtwórcą wyszukiwarki Polar Rose

Światowe Forum Ekonomiczne (WEF) uhonorowało Polar Rose tytułem Pioniera Technologicznego roku 2008. To wyjątkowe wyróżnienie wskazuje między innymi na to jak istotną rolę może odgrywać w dzisiejszym świecie obraz w połączeniu z  nowymi technologiami.

Myśląc o fotografii w internecie, do jednego z ciekawszych przedsięwzięć ostatnich lat zaliczyłbym właśnie Polar Rose.  W tworzeniu tego docenionego już projektu bierze udział grupa polskich programistów. Od prawie dwóch lat jednym z nich jest Tomek Korzeniowski, który zgodził się odpowiedzieć na kilka pytań.

Tomku, za Polar Rose kryje się technologia umożliwiająca przeszukiwanie zdjęć ludzi w zasobach internetu. Co unikalnego jest w tym projekcie, czego nie znajdziemy w innych wizualnych wyszukiwarkach?

Tomek Korzeniowski: To co odróżnia nas od innych wyszukiwarek takich jak images.google.com, picsearch.com to technologia rozpoznawania twarzy na zdjęciach i próba wydobycia semantyki z samego zdjęcia a nie tekstu. Tak naprawdę obecnie większość wyszukiwarek obrazów są tak naprawdę wyszukiwarkami tekstowymi.

Chciałbym w tym miejscu zaznaczyć, ze detekcja twarzy i rozpoznawanie twarzy to dwa różne przedsięwzięcia. Detekcja polega na określeniu, że dany element na zdjęciu jest twarzą. Rozpoznawanie zaś polega na zbudowaniu matematycznej reprezentacji twarzy.  Dzięki takiemu modelowi możemy zbudować funkcję podobieństwa i znaleźć inne zdjęcia z daną osobą.

Najbardziej zaawansowanym naszym konkurentem jest Google. W 2006 roku Google kupiła firmę Neven Vision, która zajmowała się badaniami w obszarze Computer Vision i od kilku miesięcy możemy zauważyć w produktach Google detekcję twarzy (images.google.com w zaawansowanych opcjach) a ostatnio (Picasa) pierwsze próby wykorzystania mechanizmów rozpoznawania twarzy.

Niemniej jednak nasza wyszukiwarka nadal pozostaje unikalnym produktem w pełni opartym o wyniki badań w obszarze Computer Vision i mechanizm rozpoznawania twarzy.

Przy każdej analizie twarzy pod uwagę branych jest 90 parametrów antropometrycznych. Które z nich są najistotniejsze w tym procesie identyfikacji?

TK: Z reguły kiedy zadawane jest mi tego typu pytanie… oczekiwana jest odpowiedź w stylu… odległość między oczyma jest kluczowa albo kolor skóry i kształt podbródka :-) Prawda jest taka, że wektor reprezentujący twarz jest kombinacją elementów 2D/3D danej twarzy oraz tekstury.

Bez wątpienia twarze się zmieniają. Zarówno pod wpływem czasu jak i innych tymczasowo dodanych elementów. Zarost, okulary czy nakrycie głowy mogą znacznie odmienić nasz wygląd. W jaki sposób radzi sobie z tym faktem algorytm Polar Rose?

TK: Hmm.. ciekawym przykładem może być jeden z naszych użytkowników. Zauważyliśmy, że od kilku lat robi codziennie zdjęcie swojej twarzy. Ponieważ użytkownik ten nazwał jedno z swoich zdjęć, nasz program rozprzestrzenił to nazwisko do wszystkich zdjęć twarzy tego użytkownika.

To jest miły przypadek… jednak w większości sytuacji jeżeli wraz z wiekiem nasza twarz mocno się zmienia nie będziemy w stanie na wysokim poziomie ufności określić czy to ta sama osoba. Stosunkowo łatwo radzimy sobie z elementami jak broda czy kapelusz. Możemy mieć problemy jeżeli osoba ma założone duże ciemne okulary… wtedy… z reguły nasz algorytm traktuje taką twarz jak twarz innej osoby z dużymi ciemnymi okularami :-)

Projekt jest w fazie beta, jednak już teraz na przeszło 50 milionach zdjęć, zidentyfikowanych zostało ponad 300 tysięcy osób. Ile czasu może zająć dotarcie do momentu, kiedy to większość ludzi znajdzie swoje zdjęcia w Waszej bazie? Czy jest to jedynie kwestią czasu?

TK: Prawdę powiedziawszy to mogłoby nastąpić dość szybko. Jakiś czas temu uruchomiliśmy naszego crawl-era. Po pewnym czasie jego działalności musieliśmy go wyłączyć. Zbyt dużo danych gromadziliśmy i przy obecnym stanie naszej infrastruktury i utrzymaniu dużego tępa wzrostu index-u musielibyśmy dokonać poważnych inwestycji w sprzęt oraz pewnych zmian w samym produkcie.

Możemy więc oczekiwać, że jeśli infrastruktura będzie wystarczająco rozbudowana, to żadnej buzi w internecie nie uda się umknąć przed Polar Rose. Czy jest to poniekąd Waszym celem by stworzyć globalny katalog twarzy?

TK: Naszym celem jest zbudowanie serwisu, który można określić mianem CDDB zdjęć. CDDB to największa internetowa kolekcja informacji na temat płyt CD (zawiera dane na temat wykonawcy tytułu danego albumu oraz listę utworów).

My chcielibyśmy zbudować podobny indeks dla zdjęć zamieszczonych w internecie… w szczególności osób znajdujących się na tych zdjęciach.

Jako fotograf chętnie sprawdziłbym czy wykonane prze ze mnie zdjęcia - nie koniecznie portretowe - wykorzystywane są gdzieś bez mojej wiedzy. Czy bierzecie pod uwagę wprowadzenie takich usług?

TK: Usługa nie jest wprawdzie na naszej obecnej roadmap-ie ale ten temat cały czas powraca i rozważamy taką funkcjonalność. Kilka miesięcy temu zbudowaliśmy prototyp takiej usługi, która korzysta z pełnej charakterystyki zdjęcia i umożliwia znalezienie zdjęć wykorzystanych bez wiedzy autora.

Obecnie mamy program do rozprzestrzeniania nazw na twarzach, które uznamy za duplikaty. W pewnym sensie sam ten program może służyć do wykrywania kradzieży zdjęć portretowych np: możemy dowiedzieć się gdzie zostało wykorzystane dane zdjęcia Einsteina… nawet, jeżeli zostało poddane obróbce i modyfikacjom

Polar Rose znajdziemy między innymi w takich serwisach zdjęciowych jak 23hq.com czy Twitxr.com. Można sobie wyobrazić, że przy wykorzystaniu zasobów takich miejsc jak Nasza-Klasa czy Fotka, w krótkim czasie połowa Polaków zostałaby skatalogowana. Czy serwisy społecznościowe brane są pod uwagę w Waszych planach?

TK: Integracja z serwisami społecznościowymi oraz współpraca z serwisami katalogującymi zdjęcia jest częścią naszej strategii na najbliższe miesiące.

W chwili obecnej finalizujemy umowy o współpracy z dwoma nowymi partnerami, którym udostępnimy funkcjonalność jaką oferuje teraz Picasa. Równocześnie pracujemy nad nowym produktem, który może uatrakcyjnić wymianę się zdjęciami. Ludzie z reguły najbardziej zainteresowani są zdjęciami, na których znajdują się oni sami lub ich znajomi.

Mamy nadzieję, że nasz pomysł stworzy nową jakość w tym obszarze.

Właśnie tej nowej jakości życzę Tobie i całemu zespołowi. Dziękuję Tomku za rozmowę.

TK: Dziękuję Alku!


Tomasz Korzeniowski
Niepoprawny marzyciel, początkujący muzyk, doświadczony “budowlaniec” oprogramowania i mol książkowy. Od kilku lat żyje z mocnym przekonaniem, aby zawsze podążać za głosem swojego serca i żyć z pasją. Lubi zmiany, nowe wyzwania, ciekawe miejsca oraz ludzi. Zawodowe zainteresowania skupia wokół inżynierii oprogramowania, wyszukiwania informacji i eksploracji danych a pomysły w tym obszarze realizuje podczas pracy w Polar Rose - www.polarrose.com
Od niedawna swoimi przemyśleniami i doświadczeniami dzieli się z sieciowymi przyjaciółmi na swoim kawałku przestrzeni w Internecie - tomek.codequest.eu.



Komentarze: 2 »

  1. avatar Radek

    Znam Polar Rose od dawna, ale nie przypuszczałem ,że to kosztowało tyle pracy i jest tak skomplikowane. Świetny art. Dzięki.

  2. avatar Michał Kruszewa

    Zastanawia mnie jedna rzecz. Jak zostanie rozwiązany problem z takimi sytuacjami gdy zdjęcia są opisywane przy dynamicznie zmieniających się stronach. Jeśli opiszemy kogoś w twitterze, albo na głównej stornie serwisu niusowego to krótkim czasie link prowadzi do strony gdzie ta osoba nie jest widoczna.

    Wiadomo, że najważniejsze by zdjęcie zostało opisane, ale potem mnóstwo linków z PolarRose prowadzi do złych miejsc. Macie jakiś pomysł na to?

RSS dla komentarzy do tego wpisu. | TrackBack URL | Gravatar - Twój komentarz z Twoją grafiką.


    Twój komentarz: