IPS je Účel a funkcie systémov na vyhľadávanie informácií
IPS je Účel a funkcie systémov na vyhľadávanie informácií

Video: IPS je Účel a funkcie systémov na vyhľadávanie informácií

Video: IPS je Účel a funkcie systémov na vyhľadávanie informácií
Video: Вместо того, чтобы ждать, когда я похудею, я просто изучила свой тип фигуры. 2024, November
Anonim

Pre moderného človeka je ťažké predstaviť si život bez internetu a takmer okamžitého prístupu k zdrojom informácií. Používateľ zriedka premýšľa o tom, ako sa vykonáva vyhľadávanie požadovaného obsahu v sieti. Ale toto je veľmi zaujímavé.

Systém na vyhľadávanie informácií (IPS) je komplexný softvérový a hardvérový systém, ktorý vyberá informácie na žiadosť používateľa. Informácie sú uložené na serveroch v digitálnej forme, ako boli knihy na pultoch knižníc. Systém pozostáva z mnohých podsystémov. Každý plní svoju úlohu v procese spracovania požiadavky užívateľa a poskytovania informácií mu v textovej alebo zvukovej podobe. Množstvo úloh, ktoré je potrebné riešiť, určuje zložitosť architektúry moderných systémov na vyhľadávanie informácií (skratka pre systém vyhľadávania informácií). Akási "čierna skrinka": na vstupe - text žiadosti, čo je vo vnútri - nie je známe, na výstupe - komplexné informácie.

Kartotéka v reálnom živote
Kartotéka v reálnom živote

Vstupné streamy

Žiadosti o informácie, ktoré osoba vytvorí v textovej forme na obrazovke svojho modulu gadget,tvoria malú časť žiadostí spracovaných vyhľadávacím nástrojom. Hlavné polia vyhľadávacích dopytov tvoria roboty, ktoré akceptujú ľudskú požiadavku a vykonajú viackrokové vyhľadávanie a spätnú väzbu s používateľom. Systémy na vyhľadávanie informácií zahŕňajú známe spoločnosti Google, Yandex a ďalšie, ktoré denne spracúvajú milióny žiadostí.

Objekty vyhľadávania zdrojov

Množina počiatočných objektov záujmu pre vyhľadávanie sú dokumenty, záznamy, videá, obrázky a ďalšie. Sú vytvorené mimo IPS. Všeobecný systém na ukladanie a vyhľadávanie informácií by mal mať zabudovaný bibliografický systém – druh katalógu, ktorý vám umožní vyhľadávať akýkoľvek druh objektov.

Objekty alebo ich digitálne transformácie sa stávajú „vstupným zdrojom“do IPS. Práve medzi nimi sú vybrané informácie, ktoré používateľ potrebuje.

Hľadajte informácie
Hľadajte informácie

Externé zdroje

Zobrazenie výberu informácií využíva externé zdroje znalostí. Toto sú informácie, ktoré používateľ hľadá. Názov filmu, citát z knihy a ďalšie. Pre vyhľadávanie v počítači musia byť tieto informácie preložené do dotazu v algoritmickom jazyku. V IPS sa to robí pomocou bloku na vytváranie, indexovanie a vývoj dopytov.

V ideálnom prípade by sa tieto tri procesy – reprezentácia, indexovanie a vývoj dopytov – mali opierať o identické zdroje znalostí, ale v praxi to nie je možné dosiahnuť.

Zdroje znalostí by sa mali neustále kontrolovať a aktualizovať a aktualizácia by mala byť identická asynchronizované. A externý zdroj vedomostí vždy chronologicky predchádza jeho použitiu vo vyhľadávačoch na dopyt, niekedy aj o niekoľko rokov.

Systém na vyhľadávanie informácií
Systém na vyhľadávanie informácií

Výkony

Reprezentácie pôvodných objektov sa skladajú zo vstupných údajov v určitej kombinácii alebo sú transformované v súlade s pravidlami a algoritmami konkrétneho systému na vyhľadávanie informácií.

Zobrazenia sú viac-menej transformované kópie pôvodného objektu vyhľadávania. V zbierke neupravených plných textov je každý text vlastným zobrazením. V zbierke predmetov muzeálnych exponátov a artefaktov môže byť reprezentáciou transformovaný popis predmetu s jeho vyobrazením. V niektorých prípadoch môže byť zobrazenie čiastočne odvodené od pôvodného objektu a čiastočne od popisu: v bibliografických vyhľadávačoch sú zobrazenia odvodené od objektu - napríklad názov, meno autora sa spojí s anotáciou diela.

Nájdenie toho, čo potrebujete
Nájdenie toho, čo potrebujete

Vyhľadateľný index

Keďže informácie v systémoch na vyhľadávanie informácií sú uložené vo forme zobrazenia, je logické predpokladať, že vyhľadávanie sa vykonáva podľa zobrazenia a po výbere sa poskytuje používateľovi. V praxi to tak nie je. Napríklad aktuálne katalógy online knižníc zvyčajne obmedzujú vyhľadávanie na niekoľko polí: autor, názov a titulky v zobrazení, ktoré obsahuje iné polia, ktoré sa neprehľadávajú. To je dostatočný dôvod, prečo je potrebné rozlišovaťzobrazenie a prehľadávateľný index, ktorý je časťou zobrazenia na vyhľadávanie. Definuje všetko, čo by sa malo dať vyhľadať. Vyhľadávateľný index, ako napríklad zobrazenie a zdrojový objekt, možno rozdeliť do samostatných podindexov, aby sa zabezpečilo presnejšie a cielenejšie vyhľadávanie

Vyhľadávače zvyčajne majú interne syntetickú štruktúru na porovnávanie platných výsledkov vyhľadávania. Táto štruktúra je druhou zložkou prehľadávateľného indexu.

Procedurálne môže byť proces indexovania implementovaný rôznymi spôsobmi: prehľadávateľný index možno získať:

  • doslova kopírovanie zobrazenia s možnosťou vyhľadávania;
  • skopírovaním podrobností zobrazenia. Môže ísť o časť alebo všetky zobrazenia, ktoré fyzicky existujú len ako fragmenty, distribuované podľa pravidiel na vytváranie indexu na vyhľadávanie, ktorý sa v prípade potreby zhromaždí.
Správa vyhľadávania
Správa vyhľadávania

Pravidlá dizajnu žiadostí a formálne požiadavky

Dopytové inžinierstvo je funkcia, ktorá sprostredkúva dopyt používateľa a formálny dopyt. Transformuje dotaz užívateľa, priraďuje ho k slovníkom príkazov na vyhľadávanie, špecifikácii indexu a indexu pred načítaním. Na úsvite vývoja IPS bola táto úloha tradične pridelená kvalifikovaným IT špecialistom.

Vývoj počítačových dopytov, ktoré dokážu priradiť slovníkové dopyty do prehľadávateľného indexového systému, sa bežne označuje ako modul „vstup do slovníka“. Automatizácia tejto funkcie je sľubná a ponúka príležitosti pre expertné a pravdepodobnostné metódy vyhľadávania.

Formálna žiadosť sa stane formálnou žiadosťou po konverzii žiadosti používateľa. Príklady takýchto formálnych transformácií zahŕňajú skrátenie, substitúciu, normalizáciu, vektorizáciu a iné transformácie „externej“reprezentácie na „internú“reprezentáciu počítačového IPS (dešifrovanie – systém získavania informácií).

Súpravy odkazov na extrahovaný dokument

Výsledná množina informačných zdrojov je logicky podmnožinou pohľadov vytvorených párovacími pravidlami aplikovanými na formálny dopyt pomocou prehľadávateľného indexu.

Zvyčajne, ale nie nevyhnutne, existuje samostatný proces triedenia obnoveného súboru informácií. Online katalógy knižníc zvyčajne pred zobrazením zoraďujú prijaté sady abecedne podľa autora. V systémoch na vyhľadávanie informácií, ktoré vytvárajú prísne hodnotenia, poradie poradia predchádza akejkoľvek zmene poradia.

Analýza dát
Analýza dát

Výstupné toky

Výstup výsledkov vyhľadávania sa vykonáva tradične na displeji, častejšie vo forme prúdu objektov, ktoré sa majú použiť inde alebo na iný účel, dopĺňa hlavnú slučku vyhľadávania. Takéto prúdy možno odosielať do vizualizačných zariadení, úložisko na ďalšie spracovanie alebo použitie ako vstupné toky do iných výberových služieb.

Systémy na vyhľadávanie informácií umožňujú spätnú väzbu odvýstupom akéhokoľvek výberového procesu. Výstupom akéhokoľvek procesu môže byť spätná väzba pre iné procesy. Spätná väzba môže poskytnúť základ pre odborný úsudok v ktorejkoľvek fáze.

Odporúča: