IPS je Namen in funkcije sistemov za iskanje informacij

Kazalo:

IPS je Namen in funkcije sistemov za iskanje informacij
IPS je Namen in funkcije sistemov za iskanje informacij

Video: IPS je Namen in funkcije sistemov za iskanje informacij

Video: IPS je Namen in funkcije sistemov za iskanje informacij
Video: Little Big Workshop Tips And Tricks (немецкий,много субтитров) комната отдыха, исследование, чертежи 2024, April
Anonim

Sodobna oseba si težko predstavlja življenje brez interneta in skoraj takojšnjega dostopa do virov informacij. Uporabnik le redko razmišlja o tem, kako poteka iskanje želene vsebine v omrežju. Ampak to je zelo zanimivo.

Sistem za iskanje informacij (IPS) je kompleksen sistem programske in strojne opreme, ki izbira informacije na zahtevo uporabnika. Informacije so shranjene na strežnikih v digitalni obliki, kot so bile knjige na policah knjižnic. Sistem je sestavljen iz številnih podsistemov. Vsak opravlja svojo nalogo v procesu obdelave uporabnikove zahteve in mu posreduje informacije v besedilni ali zvočni obliki. Množičnost nalog, ki jih je treba rešiti, določa kompleksnost arhitekture sodobnih sistemov za iskanje informacij (okrajšava za sistem za iskanje informacij). Nekakšna "črna skrinjica": na vhodu - besedilo zahteve, kaj je notri - ni znano, na izhodu - izčrpne informacije.

Kartica v resničnem življenju
Kartica v resničnem življenju

Vhodni tokovi

Zahteve za informacije, ki jih oseba oblikuje v besedilni obliki na zaslonu svojega pripomočka,predstavljajo majhen del zahtev, ki jih obdeluje iskalnik. Glavne nize iskalnih poizvedb tvorijo roboti, ki sprejmejo človeško zahtevo in izvedejo večstopenjsko iskanje ter povratne informacije z uporabnikom. Sistemi za iskanje informacij vključujejo dobro znane Google, Yandex in druge, ki dnevno obdelujejo na milijone zahtev.

Objekti iskanja vira

Nabor začetnih predmetov, ki jih zanima iskanje, so dokumenti, zapisi, videoposnetki, slike in drugo. Ustvarjene so zunaj IPS. Splošni sistem za shranjevanje in iskanje informacij mora imeti vgrajen bibliografski sistem – nekakšen katalog, ki omogoča iskanje poljubnih predmetov.

Objekti ali njihove digitalne transformacije postanejo "vstopni vir" v IPS. Med njimi so izbrane informacije, ki jih uporabnik potrebuje.

Poiščite informacije
Poiščite informacije

Zunanji viri

Prikaz izbire informacij uporablja zunanje vire znanja. To so informacije, ki jih uporabnik išče. Naslov filma, citat iz knjige in še več. Za računalniško iskanje je treba te informacije prevesti v poizvedbo v algoritemskem jeziku. V IPS se to naredi z uporabo bloka za ustvarjanje, indeksiranje in razvoj poizvedb.

V idealnem primeru bi se morali ti trije procesi – zastopanje, indeksiranje in razvoj poizvedb – zanašati na enake vire znanja, vendar v praksi to ni dosegljivo.

Vire znanja je treba nenehno pregledovati in posodabljati, posodobitev pa mora biti enaka insinhronizirano. Zunanji vir znanja je vedno kronološko pred njegovo uporabo v iskalnikih za poizvedbo, včasih za več let.

Sistem za iskanje informacij
Sistem za iskanje informacij

nastopi

Predstavitve izvirnih objektov so sestavljene iz vhodnih podatkov v neki kombinaciji ali preoblikovana v skladu s pravili in algoritmi določenega sistema za iskanje informacij.

Pogledi so bolj ali manj preoblikovane kopije prvotnega iskalnega predmeta. V zbirki neurejenih polnih besedil je vsako besedilo svojo reprezentacijo. V zbirki predmetov muzejskih eksponatov in artefaktov je predstavitev lahko transformiran opis predmeta z njegovo podobo. V nekaterih primerih je predstavitev lahko delno izpeljana iz izvirnega predmeta in deloma iz opisa: v bibliografskih iskalnikih so reprezentacije izpeljane iz predmeta – na primer naslov, ime avtorja bodo združeni s pripisom dela.

Iskanje tistega, kar potrebujete
Iskanje tistega, kar potrebujete

Iskalni indeks

Ker so informacije v sistemih za iskanje informacij shranjene v obliki predstavitve, je logično domnevati, da se iskanje izvede po predstavitvi in se po izbiri poda uporabniku. V praksi temu ni tako. Na primer, trenutni katalogi spletnih knjižnic običajno omejujejo iskanje na nekaj polj: avtor, naslov in podnapisi v pogledu, ki vsebuje druga polja, ki niso iskana. To je zadosten razlog, zakaj je treba razlikovatipogled in iskani indeks, ki je iskalni del pogleda. Opredeljuje vse, kar bi moralo biti iskano. Indeks, ki ga je mogoče iskati, kot sta pogled in izvorni predmet, je mogoče razdeliti na ločene podindekse, da zagotovite natančnejša, ciljno usmerjena iskanja

Iskalniki imajo običajno notranjo sintetično strukturo za ujemanje veljavnih rezultatov iskanja. Ta struktura je druga komponenta indeksa, ki ga je mogoče iskati.

Proceduralno se lahko postopek indeksiranja izvede na različne načine: indeks, ki ga je mogoče iskati, je mogoče dobiti z:

  • dobesedno kopiranje iskane reprezentacije;
  • s kopiranjem podrobnosti pogleda. To so lahko del ali vsi pogledi, ki fizično obstajajo samo kot fragmenti, porazdeljeni v skladu s pravili za ustvarjanje indeksa za iskanje, ki bo po potrebi zbran.
Upravljanje iskanja
Upravljanje iskanja

Zahtevaj pravila oblikovanja in formalne zahteve

Inženiring poizvedb je funkcija, ki posreduje med uporabniško poizvedbo in formalno poizvedbo. Preoblikuje uporabniško poizvedbo in jo pred iskanjem primerja z ukaznimi slovarji za iskanje, specifikacijo indeksa in indeksom. Na zori razvoja IPS je bila ta vloga tradicionalno dodeljena usposobljenim IT strokovnjakom.

Razvijanje računalniških poizvedb, ki se lahko ujemajo s slovarskimi poizvedbami v indeksni sistem, ki ga je mogoče iskati, se običajno imenuje modul »vnos slovarja«. Avtomatizacija te funkcije je obetavna in ponuja možnosti za strokovne in verjetnostne metode iskanja.

Formalna zahteva postane uradna zahteva, potem ko je bila zahteva uporabnika pretvorjena. Primeri takšnih formalnih transformacij vključujejo skrajšanje, zamenjavo, normalizacijo, vektorizacijo in druge transformacije "zunanje" predstavitve v "notranje" predstavitve računalniškega IPS (dešifriranje - sistem za iskanje informacij).

Izvlečeni nizi povezav do dokumentov

Dobljeni niz virov informacij je logično podmnožica pogledov, ustvarjenih s pravili ujemanja, uporabljenimi za formalno poizvedbo z indeksom, ki ga je mogoče iskati.

Običajno, vendar ni nujno, obstaja ločen postopek razvrščanja za obnovljeni niz informacij. Spletni knjižnični katalogi običajno pred prikazovanjem prerazporedijo prejete komplete po abecedi po avtorju. V sistemih za iskanje informacij, ki zagotavljajo stroge uvrstitve, je vrstni red pred vsakim preureditev.

Analiza podatkov
Analiza podatkov

Izhodni tokovi

Izpis rezultatov iskanja poteka tradicionalno na zaslonu, pogosteje v obliki toka predmetov, ki se uporabljajo drugje ali za kakšen drug namen, zaključi glavno iskalno zanko. Takšni tokovi se lahko pošljejo na naprave za vizualizacijo, shranjevanje za nadaljnjo obdelavo ali uporabo kot vhodni tokovi za druge izbirne storitve.

Sistemi za iskanje informacij omogočajo povratne informacije odrezultat katerega koli izbirnega postopka. Rezultat katerega koli procesa je lahko povratna informacija drugim procesom. Povratne informacije lahko zagotovijo osnovo za strokovno presojo na kateri koli stopnji.

Priporočena: