Rep.hr pronašao autore sustava koji broji ljude na prosvjedima

Rep.hr pronašao autore sustava koji broji ljude na prosvjedima

Autori sustava za automatsko određivanje broja ljudi na fotografijama dr. sc. Nikola Banić i Marin Maržić, mag. ing. comp., u razgovoru za rep.hr otkrili su kako još nisu planirali predstavljati svoj sustav koji je nedavno završio u brojnim medijima nakon što je dekan FER-a na Facebooku objavio procjenu broja ljudi na jednom prosvjedu.

Razgovor je vođen na FER-u na kojem Banić radi kao poslijedoktorand, dok je Maržić COO u tvrtki Electrocoin poznatoj po Bitcoin mjenjačnici.

Do trenutka kad mi je dekan odgovorio na upit, nigdje nisam uspio pronaći da ste vas dvojica autori sustava. Čemu tolika tajnovitost?
NB: Nema nikakve planirane tajnovitosti, samo još nismo planirali izlaziti u javnost i na tržište jer nemamo finalnu verziju sustava i jer nismo još pokrenuli startup koji će stajati iza sustava, tako da su nas objave u medijima malo zatekle.

Kako ste došli do ideje?
MM: Nikola je u jednoj situaciji komentirao kako je nečija procjena broja ljudi bila netočna i zaključio kako bi bilo dobro i zanimljivo raditi na tome. U početku je to bio samo njegov hobi, onda smo napravili nešto konkretnije, da bi konačno zaživio prije nekoliko mjeseci.

Za one koji ga još nisu vidjeli, što sustav točno radi?
NB:
Sustav analizira neku fotografiju ili video tako što prepoznaje i broji lica na njoj, kako bi došao do informacije o ukupnom broju ljudi na nekoj lokaciji, odnosno na onom dijelu lokacije koja je pokrivena fotografijom.

Koliko je točan u procjenama?
NB:
Ako je fotografija zadovoljavajuće kvalitete, broj pogrešaka je mali, s time da sustav broji samo one ljude koji se vide. Ako se oni, odnosno njihove glave, nalaze iza objekata – stabala, kišobrana, tendi i drugih, sustav ih ne bilježi.

Analizirali ste broj ljudi na nekoliko prosvjeda, na onome nedavnom u Splitu, policijska procjena značajno se razlikuje od vaše. Kako je to moguće i koju metodu koristi policija?
NB:
Ne znam koju metodu oni koriste, ali moj dojam je da je njima najbitnije osiguranje prosvjeda od izgreda što im ide uspješno, dok je brojanje ljudi na prosvjedima za njih možda nešto sporednija stvar pa vjerojatno zato postoje takva odstupanja.

Koliko je lako procijeniti takve podatke bez softvera?
NB:
Lako se pogriješi, jer sve ovisi o tome gdje se gleda, gustoća ljudi na jednom mjestu može puno varirati, a to može zavarati ljude.

Na portalima koji su objavili vaše analize i na društvenim mrežama bilo je raznih komentara, među kojima i oni o izboru fotografija kojima ste mogli umanjiti ili uvećati značaj nekog prosvjeda. Po kojem kriteriju ste birali fotografije koje ste analizirali?
NB:
Uzimali smo najbolje koje smo mogli naći. Ako netko nije zadovoljan, neka nam pošalje neku drugu kvalitetnu fotografiju pa ćemo rado korištenjem softvera prebrojiti koliko je ljudi na njoj.

Postoje li već slični sustavi u svijetu?
NB:
One koji broje veliki broj ljudi nismo vidjeli. Vidjeli smo rješenje koji broji ljude kod ulaza i izlaza u dućan, ali sumnjam da bi se ono moglo automatski na odgovarajući način nositi s velikim skupom podataka.

Objavili ste nekoliko videa na svom YouTube kanalu. Jeste li imali kakvih zanimljivih upita na osnovu YouTube videa koje ste postavili?
NB:
Jesmo i moglo ih je biti i više, no na kanalu su trenutno svi videi s prethodnim snimkama rezultata skriveni i dostupni samo uz poznavanje poveznice jer nismo htjeli odmah izazivati pažnju, ovdje je cijela stvar isto krenula slučajno nakon što je jedna od poveznica nehotice procurila. Od zanimljivih primjera javljanja zanimljivo je spomenuti jednog čovjeka iz Gane, poslao nam je svoje fotografije iz velike crkve kako bismo odredili koliko ljudi je bilo unutra. Bilo je tu i izazova za softver, ne želim zvučati rasistički, ali crnac u loše osvijetljenoj prostoriji se puno teže vidi od bijelca.

Koje tehnologije ste koristili u razvoju sustava?
MM:
Koristili smo tehnike dubokog učenja. Čovjek računalu da uzorke lica, a računalo ih samo nauči prepoznavati i evoluira u sustavu koji radi sam od sebe. 
NB: Sustav nije potrebno učiti iz početka, mogu se uzeti postojeće arhitektura i nadograditi licima. Za obradu i produkciju koristili smo Python, TensorFlow - Googleov framework za deep learning i OpenCV library.

Je li sustav za prepoznavanje lica trebalo razvijati ispočetka?
NB: Ne u potpunosti, danas se to rijetko radi. Obično se od postojećih i javno dostupnih modela za računalno razumijevanje slike odabere jedan i na poznatom skupu za specifični problem ga se dodatno prilagodi onome što je potrebno.

Što je bilo najteže u dosadašnjem razvoju?
NB:
Najveća prepreka je dobiti dobre fotografije.
MM: U savršenoj kvaliteti stvar savršeno radi.

Kakva treba biti fotografija da bi brojanje dobro funkcioniralo?
MM:
Najbitnija je jasnoća glava na fotografiji, ako je taj dio mutan, znatno je teže.

Na osnovu vaših analiza vjerojatno se mogu dobiti razni zanimljivi podaci. Jeste li analizirali koliko ljudi stane na kvadratni metar?
NB:
Analizirajući fotografije s jednog zagrebačkog prosvjeda došli smo do podataka tog tipa za taj jedan konkretni slučaj. Prosjek za cijelu fotografiju bio je 3,38 ljudi po kvadratnom metru, dok je maksimum bio devet, ali to se dogodilo samo na jednom mjestu. Nekad otac drži sina na ramenima, i to su primjerice već dvije osobe u malo prostora.

Postoji li problem vezan uz privatnost zbog činjenice da se na fotografijama vide lice ljudi?
NB:
Ne, lako možemo blurati ili zacrniti sva lica nakon analize.

Kakav model korištenja vašeg rješenja ste mislili ponuditi tržištu? Aplikaciju na webu koja nudi upload fotografija?
MM:
To još nismo precizno zamislili. Možda bismo ponudili uslugu, možda licenciranje, možda nekakav drag&drop na webu, nismo još istraživali što bi bila najbolja opcija. Nismo ni svjesni svih situacija kad netko treba prebrojavanje – možda organizatorima evenata dobro dođe znati koliko ljudi pohađa njihov event. Trebat će nam još vremena dok dođemo do te faze.