Što su API-ji za prepoznavanje slika i što mogu učiniti za vas? Ovaj će članak pojasniti što je prepoznavanje slike, što API radi i kako može pomoći vama ili vašoj tvrtki da iskoriste više interneta. Prepoznavanje slike ima ogroman potencijal za tvrtke i za pojedine korisnike interneta sa slabovidom.
Što je API za prepoznavanje slike?
Prepoznavanje slike je dio softvera koji prepoznaje karakteristike slike i precizno je kategorizira. Na primjer, ako umetnete sliku Ferrarija 458 u API za prepoznavanje slike, trebao bi prepoznati da je automobil i da je (ili bi trebao biti) crven. Ovisno o API-ju, moguća je daljnja klasifikacija ovisno o vrsti slike koju koristite.
To se može činiti vrlo jednostavnim - ljudi mogu pogledati sliku i reći vam kakva je to slika, a da to ne pokušavate, većinu vremena - ali to je bilo teško naučiti riješiti računala. Puno je posla uloženo u pronalaženje načina na koji računalo može shvatiti kako stvari izgledaju, a napravili smo veliki napredak, od mogućnosti vršenja obrnutog pretraživanja slika do poznate Googleove mreže Deep Dream.
API je sučelje aplikacijskog programa. U osnovi je posrednik između programskih rutina koji jednom elementu govori kako raditi s drugim ili pruža alate potrebne za obavljanje funkcije. Postoji nekoliko desetaka vrsta API-ja koji mogu postići sve vrste ciljeva, koristeći niz programskih jezika. U tom je kontekstu API za prepoznavanje slike alat koji možete koristiti za pristup dubokoj moći učenja nekih komercijalnih sustava za prepoznavanje slika.
Za prepoznavanje slike trebate mnogo računalne snage. Potrebne su vam mase podataka i mogućnost da sve to protumačite. Većina korisnika jednostavno nema ogromne resurse za izgradnju vlastitog stroja za duboko učenje. Velika imena poput Google-ovog Vision API-ja, Microsoftovog API-ja za lice, ImageNet-a i drugih imaju takve strojeve i omogućuju im pristup putem API-ja, besplatno ili uz naknadu. To omogućuje tvrtkama svih veličina pristup ovoj moći i korisnicima kao rezultat toga nova iskustva.
Kako će prepoznavanje slika promijeniti naše internetsko iskustvo?
Različiti korisnici interneta dobit će različite prednosti od prepoznavanja slika. Pogledajmo hipotetičkog vlasnika web stranice i hipotetičkog korisnika da vidimo kako obje strane mogu imati koristi.
Poslovne prednosti prepoznavanja slika
Kao primjer, recimo da vodite portal za samostalnu prodaju sličan Etsyju ili web stranicu za upoznavanje. Želite upravljati kvalitetom i prikladnošću svih slika koje su korisnici učitali. Želite blokirati sve slike za odrasle ili neprimjerene i razvrstati ih u odgovarajuće kategorije, ali ne možete to učiniti sve ručno.
Unesite API za prepoznavanje slike. Možete koristiti API, zajedno s odgovarajućim uređajem za prepoznavanje slike, za skeniranje svake pojedine slike i definiranje prema postavljenim kriterijima. Tako biste mogli skenirati knjižnicu slika na temelju nepristojnih slika i izbrisati ih. Možete skenirati slike i sortirati one koji sadrže hranu u kategoriju "hrana", a pletenine u kategoriju "vunene". Jednom kada kažete API što treba učiniti, proces se automatizira.
Tu su i mogućnosti za proširenu stvarnost i interaktivni imidž i video. Prepoznavanje slike možete koristiti za prepoznavanje programa u stvarnom svijetu. Na primjer, možete slikati par tenisica koje netko nosi na ulici. Ako program prepozna patike, sliku može nadopuniti vezom kako biste ih kupili za sebe. To koristi poduzećima (nudi neposrednu prodajnu priliku) i koristi korisniku (dobivaju ono što sada žele).
Korisnik koristi prepoznavanje slike
Gore navedeni primjer tenisica samo je jedan očit način na koji korisnici mogu imati koristi od prepoznavanja slika. Proširena stvarnost znači da bismo mogli odmah pristupiti recenzijama, informacijama o cijenama i puno podataka jednostavnim fotografiranjem proizvoda. To korisnicima daje ogromne količine podataka kako bi im pomogli da donesu odluku o kupnji.
Mark Zuckerberg je u svom govoru o AI početkom ove godine iznio često previdjenu korist prepoznavanja slike. Zamišio je API za prepoznavanje slike koji je radio sa slijepim ili slabovidnim ljudima koji su mogli „čitati“ sliku i opisati ono što se vidi naglas. To bi moglo imati velike posljedice za korisnike interneta s oštećenjima - ili, uz pojačanu stvarnost, neko vrijeme izvan stvarnog svijeta.
Prepoznavanje slike također igra važnu ulogu u sigurnosti vozila. Uvedene nove tehnologije autonomnog kočenja i izbjegavanja sudara slično kao kod API-ja o kojima smo govorili. Oni skeniraju i procjenjuju slike mnogo puta u sekundi kako bi zaštitili vas i vaš automobil dok ste na putu. Ova tehnologija koja autonomnim automobilima govori i ono što se nalazi oko njih.
API-ji za prepoznavanje slika neće sami prilagoditi internetsko iskustvo. Oni djeluju uporedo s postojećom tehnologijom kako bi dodali sloj interakcije i uranjanja u svijet koji vidimo. Iako su primjeri ovog članka ograničeni, postoji ogroman potencijal za igranje igara, filmove, autoindustriju, maloprodaju, zabavu i bilo koju industriju koja podržava tehnologiju. Ovo je tek početak onoga što inteligentni sustavi mogu postići!