Odprti kop - tekstovno iskanje po video arhivu
V sredo bo Andraž v Kiberpipi lansiral projekt Odprti kop, nekakšen semantični video arhiv oddaj RTV Slovenija. Imel sem to srečo, da sem lahko rešitev testiral v beta fazi in moram reči, da je kar izpolnila nalogo, ki so si jo zadali.
*UPDATE (24.5.2007): Andraž je pripravil dobro in jedrnato predstavitev, katere hilight je bil zame ideja o “I’m feeling lucky” občutku, ki bi ga uporabnikom morale dajati spletne aplikacije. Več o tem kdaj drugič…*
Kot kaže so video vsebine trenutno res najbolj vroče blago na internetu, saj se zadnji teden ali dva nenehno pogovarjam samo o projektih, kjer igra glavno vlogo video. Tako npr. Vest.si vedno bolj aktivno in uspešno producira video vsebine, YouTube in Google sta uspela definirati kaj vsak želi od videa, predvčerajšnjim pa sem govoril tudi o moji izkušnji z Joostom, ki naj bi predstavljal revolucijo gledanja televizije.
V Sloveniji smo kar se videa tiče zaenkrat kar uspešni. Imamo VoD ponudnike, novičarski portali so z videom zelo uspešni, obeta pa se nam celo zelo zanimiva novost, o kateri govorim tokrat. V sredo 23. maja bo Andraž v Kiberpipi na Spletnih uricah lansiral svoj start-up Zemanta, katerega prvi projekt je Odprti kop ali “semantični video arhiv RTV Slovenija” kot mu jaz pravim (pa naj me Andraž v sredo popravi).
Gre za video arhiv oddaj, ki so že sedaj v internetnem arhivu nacionalke, le da jih bo Zemanta, s pomočjo podnapisov za gluhe in naglušne, opremila z možnostjo tekstovnega iskalnika oz. bodo celo “najdljivi” v iskalnikih kot sta Google in Najdi.si. Ko najdeš rezultat, začneš gledati video točno tam, kjer je rezultat iskanja, torej ni potrebno gledati pol ure videa po nepotrebnem, preden pride na vrsto zanimivi del. Sistem bo imel vzpostavljeno tudi povezavo z Wikipedio, kjer bodo pojasnjeni vsi pojmi, ki se pojavijo v videu. Zveni zelo dobro, pa poglejmo.

Na prvi strani dobimo poservirane zadnje dodane oddaje, kar ni niti pol tako zanimivo, kot možnost izbora različnih oddaj v meniju ali pa sploh glavne funkcionalnosti sistema - iskanja.
Iskalnik
Iskalnik je dokaj zmogljiv, saj razume tudi osnove slovenskega jezika in vrača rezultate na iskano besedo “volitve” tudi če je najdena beseda “volitvah”, “volitev” ipd.

Prav tako iskalnik pozna osnove analize teksta, saj na iskano besedo “janez” ponudi tudi predloge, npr. “drnovšek” in “janša”.

Po kliku na predlagano besedo iskalnik izvede iskanje po tej besedi, morda pa bi bilo bolj koristno, če bi sistem predlagal kombiniranje iskanih besed, torej “janez drnovšek”, “janez janša”, saj v tem primeru že vemo, da uporabnika zanima nek Janez in bi mu bilo škoda vračati rezultate o npr. Antonu Janši po tem, ko je kliknil še predlog “janša”.
Oddaje
Po kliku na eno od oddaj, nam sistem predstavi oddajo v obliki odstavkov, torej sklopov besedila, ki nekako spadajo skupaj.

Vsak sklop besedila je nekakšno sidro, od koder lahko začnemo gledati video posnetek (brez čakanja, da se naloži pol ure videa, ki nas ne zanima) ali pa na podlagi sidra “citiramo” video na svoji strani ali svojem blogu.

Oddajo, ki se nahaja v arhivu Odprtega kopa torej lahko blogerji citiramo - še več, citiramo lahko konkreten odstavek, pri čemer nam Odprti kop pri tem celo zelo pomaga, saj nam sam pripravi HTML kodo citata, v vsebino pa vstavi vse kar je za citiranje videa pomembno: naziv oddaje, začetek besedila citata ter celo sliko.
Sistem pa pozna tudi osnove semantike, saj zna v besedilu poiskati ključne besede in za njih poiskati razlago v Wikipediji. Tako lahko kar iz besedila skočimo na predstavitveno stran na Wikipediji in tam preberemo dodatne informacije.
Rezultat?
Rezultat je zelo zanimiv, tako kot sem si obetal po Andraževem opisu pred nekaj meseci. Imamo učinkovit sistem, ki vsak video posnetek pretvori v spletno stran, kjer je ta video posnetek v celoti predstavljen z besedilom in slikami.
Avtorji so uresničili napoved, da bo poslej moč sprožiti tekstovno iskanje po video posnetkih in celo najti video posnetke s tekstovnim iskanjem po iskalnikih Google, Najdi.si ipd.
Seveda ima vse skupaj eno veliko “napako” - sistem deluje na podlagi podnapisov za gluhe in naglušne, ki jih RTV Slovenija pripravlja za nekatere oddaje, kar pa kar nekoliko zmanjša uporabnost Odprtega kopa.
Ampak OK, če se osredotočimo na tehnologijo, torej samo rešitev, ki so jo pripravili v Zemanti, vidimo da je moč takšen sistem brez težav implementirati tudi na druge video arhive, važni so le vhodni podatki. Če bi npr. nekdo ves svoj video arhiv spustil skozi sistem za prepoznavo govora (good luck!), bi bil lahko rezultat podoben temu, kar vidimo na Odprtem kopu.
Tehnično gledano je torej rešitev dobra, prostora za izboljšave pa je tudi dovolj, saj lahko v Zemanti še veliko storijo na gradnikih, ki sestavljajo sistem: jezikovnih orodjih, orodjih za analizo teksta, semantičnih orodjih, moj vtis pa je tudi, da bi se dalo že v tej fazi narediti več na uporabniškem vmesniku. Sicer nekih posebnih težav nisem imel, vendar sistemu manjka še vizualni “coolness”, ki bo pritegnil široke množice. Mi geeki pa že vidimo funkcionalni “coolness” - ideja je dobra in sistem deluje! :)
- none
Info
11 komentarjev na objavo.
- Objavljeno:
- 22. May 2007 16:40
- Kategorije:
- Delovnik
- Tags:
- internet video, Odprti kop
- Sorodni zapisi:
-
- none

11 komentarjev
Skoči na obrazec | comments rss [?] | trackback uri [?]