2024 Autor: Howard Calhoun | [email protected]. Naposledy zmenené: 2023-12-17 10:39
Pre moderného človeka je ťažké predstaviť si život bez internetu a takmer okamžitého prístupu k zdrojom informácií. Používateľ zriedka premýšľa o tom, ako sa vykonáva vyhľadávanie požadovaného obsahu v sieti. Ale toto je veľmi zaujímavé.
Systém na vyhľadávanie informácií (IPS) je komplexný softvérový a hardvérový systém, ktorý vyberá informácie na žiadosť používateľa. Informácie sú uložené na serveroch v digitálnej forme, ako boli knihy na pultoch knižníc. Systém pozostáva z mnohých podsystémov. Každý plní svoju úlohu v procese spracovania požiadavky užívateľa a poskytovania informácií mu v textovej alebo zvukovej podobe. Množstvo úloh, ktoré je potrebné riešiť, určuje zložitosť architektúry moderných systémov na vyhľadávanie informácií (skratka pre systém vyhľadávania informácií). Akási "čierna skrinka": na vstupe - text žiadosti, čo je vo vnútri - nie je známe, na výstupe - komplexné informácie.
Vstupné streamy
Žiadosti o informácie, ktoré osoba vytvorí v textovej forme na obrazovke svojho modulu gadget,tvoria malú časť žiadostí spracovaných vyhľadávacím nástrojom. Hlavné polia vyhľadávacích dopytov tvoria roboty, ktoré akceptujú ľudskú požiadavku a vykonajú viackrokové vyhľadávanie a spätnú väzbu s používateľom. Systémy na vyhľadávanie informácií zahŕňajú známe spoločnosti Google, Yandex a ďalšie, ktoré denne spracúvajú milióny žiadostí.
Objekty vyhľadávania zdrojov
Množina počiatočných objektov záujmu pre vyhľadávanie sú dokumenty, záznamy, videá, obrázky a ďalšie. Sú vytvorené mimo IPS. Všeobecný systém na ukladanie a vyhľadávanie informácií by mal mať zabudovaný bibliografický systém – druh katalógu, ktorý vám umožní vyhľadávať akýkoľvek druh objektov.
Objekty alebo ich digitálne transformácie sa stávajú „vstupným zdrojom“do IPS. Práve medzi nimi sú vybrané informácie, ktoré používateľ potrebuje.
Externé zdroje
Zobrazenie výberu informácií využíva externé zdroje znalostí. Toto sú informácie, ktoré používateľ hľadá. Názov filmu, citát z knihy a ďalšie. Pre vyhľadávanie v počítači musia byť tieto informácie preložené do dotazu v algoritmickom jazyku. V IPS sa to robí pomocou bloku na vytváranie, indexovanie a vývoj dopytov.
V ideálnom prípade by sa tieto tri procesy – reprezentácia, indexovanie a vývoj dopytov – mali opierať o identické zdroje znalostí, ale v praxi to nie je možné dosiahnuť.
Zdroje znalostí by sa mali neustále kontrolovať a aktualizovať a aktualizácia by mala byť identická asynchronizované. A externý zdroj vedomostí vždy chronologicky predchádza jeho použitiu vo vyhľadávačoch na dopyt, niekedy aj o niekoľko rokov.
Výkony
Reprezentácie pôvodných objektov sa skladajú zo vstupných údajov v určitej kombinácii alebo sú transformované v súlade s pravidlami a algoritmami konkrétneho systému na vyhľadávanie informácií.
Zobrazenia sú viac-menej transformované kópie pôvodného objektu vyhľadávania. V zbierke neupravených plných textov je každý text vlastným zobrazením. V zbierke predmetov muzeálnych exponátov a artefaktov môže byť reprezentáciou transformovaný popis predmetu s jeho vyobrazením. V niektorých prípadoch môže byť zobrazenie čiastočne odvodené od pôvodného objektu a čiastočne od popisu: v bibliografických vyhľadávačoch sú zobrazenia odvodené od objektu - napríklad názov, meno autora sa spojí s anotáciou diela.
Vyhľadateľný index
Keďže informácie v systémoch na vyhľadávanie informácií sú uložené vo forme zobrazenia, je logické predpokladať, že vyhľadávanie sa vykonáva podľa zobrazenia a po výbere sa poskytuje používateľovi. V praxi to tak nie je. Napríklad aktuálne katalógy online knižníc zvyčajne obmedzujú vyhľadávanie na niekoľko polí: autor, názov a titulky v zobrazení, ktoré obsahuje iné polia, ktoré sa neprehľadávajú. To je dostatočný dôvod, prečo je potrebné rozlišovaťzobrazenie a prehľadávateľný index, ktorý je časťou zobrazenia na vyhľadávanie. Definuje všetko, čo by sa malo dať vyhľadať. Vyhľadávateľný index, ako napríklad zobrazenie a zdrojový objekt, možno rozdeliť do samostatných podindexov, aby sa zabezpečilo presnejšie a cielenejšie vyhľadávanie
Vyhľadávače zvyčajne majú interne syntetickú štruktúru na porovnávanie platných výsledkov vyhľadávania. Táto štruktúra je druhou zložkou prehľadávateľného indexu.
Procedurálne môže byť proces indexovania implementovaný rôznymi spôsobmi: prehľadávateľný index možno získať:
- doslova kopírovanie zobrazenia s možnosťou vyhľadávania;
- skopírovaním podrobností zobrazenia. Môže ísť o časť alebo všetky zobrazenia, ktoré fyzicky existujú len ako fragmenty, distribuované podľa pravidiel na vytváranie indexu na vyhľadávanie, ktorý sa v prípade potreby zhromaždí.
Pravidlá dizajnu žiadostí a formálne požiadavky
Dopytové inžinierstvo je funkcia, ktorá sprostredkúva dopyt používateľa a formálny dopyt. Transformuje dotaz užívateľa, priraďuje ho k slovníkom príkazov na vyhľadávanie, špecifikácii indexu a indexu pred načítaním. Na úsvite vývoja IPS bola táto úloha tradične pridelená kvalifikovaným IT špecialistom.
Vývoj počítačových dopytov, ktoré dokážu priradiť slovníkové dopyty do prehľadávateľného indexového systému, sa bežne označuje ako modul „vstup do slovníka“. Automatizácia tejto funkcie je sľubná a ponúka príležitosti pre expertné a pravdepodobnostné metódy vyhľadávania.
Formálna žiadosť sa stane formálnou žiadosťou po konverzii žiadosti používateľa. Príklady takýchto formálnych transformácií zahŕňajú skrátenie, substitúciu, normalizáciu, vektorizáciu a iné transformácie „externej“reprezentácie na „internú“reprezentáciu počítačového IPS (dešifrovanie – systém získavania informácií).
Súpravy odkazov na extrahovaný dokument
Výsledná množina informačných zdrojov je logicky podmnožinou pohľadov vytvorených párovacími pravidlami aplikovanými na formálny dopyt pomocou prehľadávateľného indexu.
Zvyčajne, ale nie nevyhnutne, existuje samostatný proces triedenia obnoveného súboru informácií. Online katalógy knižníc zvyčajne pred zobrazením zoraďujú prijaté sady abecedne podľa autora. V systémoch na vyhľadávanie informácií, ktoré vytvárajú prísne hodnotenia, poradie poradia predchádza akejkoľvek zmene poradia.
Výstupné toky
Výstup výsledkov vyhľadávania sa vykonáva tradične na displeji, častejšie vo forme prúdu objektov, ktoré sa majú použiť inde alebo na iný účel, dopĺňa hlavnú slučku vyhľadávania. Takéto prúdy možno odosielať do vizualizačných zariadení, úložisko na ďalšie spracovanie alebo použitie ako vstupné toky do iných výberových služieb.
Systémy na vyhľadávanie informácií umožňujú spätnú väzbu odvýstupom akéhokoľvek výberového procesu. Výstupom akéhokoľvek procesu môže byť spätná väzba pre iné procesy. Spätná väzba môže poskytnúť základ pre odborný úsudok v ktorejkoľvek fáze.
Odporúča:
Účtovníctvo je Vlastnosti procesu sumarizácie informácií
Účtovníctvo je prvkom riadenia ekonomických objektov a procesov. Jeho podstatou je fixovanie parametrov a stavu udalostí a faktov, zbieranie, sumarizácia, hromadenie informácií a ich premietnutie do príslušných výkazov. Účtovníctvo sa vykonáva v rôznych oblastiach činnosti
Medzinárodné prevody peňazí: popis, zoznam systémov, implementačné funkcie
Aké sú spôsoby prevodu peňazí do iných krajín? Ako uskutočniť prevod cez bankový účet? Funkcie vyplnenia platobného príkazu. Obmedzenia pri posielaní peňazí. Aké sú prekladateľské systémy? Ako si vybrať správnu prekladateľskú spoločnosť? Ako vrátiť preklad a opraviť chybu v ňom?
Automatizácia riadiacich systémov: úrovne, nástroje, funkcie a aplikácie
Automatizácia riadiacich systémov alebo skrátene ACS je súbor zariadení, ktoré umožňujú efektívne a poloautomaticky alebo plne automaticky sledovať priebeh procesu. Najviac sa využívajú v priemysle
Kde získať pôžičku vo Volgograde rýchlo a bez zbytočných informácií
Takmer každý z nás sa aspoň raz v živote dostal do situácie, keď súrne potrebuje peniaze a nie je možné si požičať od priateľov. Musíte sa obrátiť na banku, ale posúdenie žiadosti môže trvať niekoľko dní. Ako byť v tejto situácii? Kde získať pôžičku vo Volgograde?
Viac informácií. Pás je
Jedným z najuniverzálnejších typov výrobkov z valcovaného kovu je pás. Jedná sa o úzky kovový pás používaný pri výrobe rezných nástrojov, pružín, kovových profilov a rôznych typov konštrukcií. Dnes sa v stavebníctve veľká časť prác realizuje pomocou kovových konštrukcií, ktoré sa vyrábajú pomocou ocele a pozinkovanej pásky