Tehnologija pronalaženja informacija. Povrat informacija

Među korisnicima koji govore ruski, najpopularnije tražilice su Google, Yandex i Rambler.

Traženje informacija kao proces

Pretraživanje informacija je proces identificiranja u određenom skupu dokumenata (tekstova) svih onih koji su posvećeni određenoj temi (predmetu), zadovoljavaju unaprijed određeni uvjet pretraživanja (zahtjev) ili sadrže potrebne (koje odgovaraju informacijskim potrebama) činjenice, informacije , podaci.

Proces pretraživanja uključuje slijed operacija usmjerenih na prikupljanje, obradu i pružanje informacija.

Općenito, potraga za informacijama sastoji se od četiri faze:

  • utvrđivanje (razjašnjenje) informacijskih potreba i formuliranje zahtjeva za informacijama;
  • utvrđivanje ukupnosti mogućih nositelja informacijskih nizova (izvora);
  • izdvajanje informacija iz identificiranih nizova informacija;
  • upoznavanje s primljenim informacijama i evaluacija rezultata pretraživanja.

Vrste pretraživanja

Metode pretraživanja

Pretraga adresa

Proces traženja dokumenata na čisto formalnim osnovama navedenim u zahtjevu.
Za provedbu su potrebni sljedeći uvjeti:

  1. Ima li dokument točnu adresu?
  2. Osiguravanje strogog rasporeda dokumenata u uređaju za pohranu ili u pohrani sustava.

Adrese dokumenata mogu biti adrese web poslužitelja i web stranica i elemenata bibliografskog zapisa, te adrese pohranjivanja dokumenata u repozitoriju.

Semantičko pretraživanje

Proces traženja dokumenata po njihovom sadržaju.

  • Prevođenje sadržaja dokumenata i upita s prirodnog jezika u jezik za pronalaženje informacija i kompilacija slika pretraživanja dokumenta i upita.
  • Sastavljanje opisa pretraživanja koji specificira dodatni uvjet pretraživanja.

Temeljna razlika između adresnog i semantičkog pretraživanja je u tome što se kod pretraživanja adresa dokument smatra objektom u smislu oblika, a u semantičkom pretraživanju - u smislu sadržaja.

Semantička pretraga pronalazi mnogo dokumenata bez navođenja adresa.

To je temeljna razlika između kataloga i kartoteka.

Pretraživanje informacija je proces identificiranja zapisa u nizu informacija koji zadovoljavaju unaprijed određeni uvjet pretraživanja ili upit.

IP razmatra traženje informacija u dokumentima, traženje samih dokumenata, izdvajanje metapodataka iz dokumenata, traženje teksta, slika, videa i zvuka u lokalnim relacijskim bazama podataka, u hipertekstualnim bazama podataka kao što su Internet i lokalni intranet sustavi.

Postoji određena zbrka oko pojmova dohvaćanja podataka, dohvaćanja dokumenata, dohvaćanja informacija i dohvaćanja teksta. Međutim, svako od ovih područja istraživanja ima svoje metode, praksu i literaturu.

Trenutno je IP područje znanosti koje se brzo razvija, čija je popularnost posljedica eksponencijalnog rasta količine informacija, posebno na Internetu. Postoji ogromna literatura i mnoge konferencije posvećene IP-u. Jedan od najpoznatijih je TREC, kojeg je 1992. godine organiziralo Ministarstvo obrane SAD-a u suradnji s Institutom za standarde i tehnologiju (NIST) s ciljem konsolidacije istraživačke zajednice i razvoja metoda za procjenu kvalitete IP-a.

Objekt zahtjeva i zahtjeva

Govoreći o IP sustavima, koriste se pojmovima upit I objekt zahtjeva.

Upit je formaliziran način izražavanja informacijskih potreba korisnika sustava. Jezik upita za pretraživanje koristi se za izražavanje potrebe za informacijama, sintaksa se razlikuje od sustava do sustava. Uz poseban jezik upita, moderne tražilice omogućuju unos upita na prirodnom jeziku.

Objekt zahtjeva je informacijska cjelina koja je pohranjena u bazi podataka automatiziranog sustava pretraživanja. Iako je najčešći objekt zahtjeva tekstualni dokument, nema temeljnih ograničenja. Konkretno, moguće je tražiti slike, glazbu i druge multimedijske informacije. Proces unosa objekata pretraživanja u IPS naziva se indeksiranje. Daleko od uvijek, IPS pohranjuje točnu kopiju objekta, često se umjesto toga pohranjuje surogat.

Zadaci traženja informacija

Središnja zadaća IP-a je pomoći korisniku da zadovolji svoje potrebe za informacijama. Budući da je tehnički teško opisati potrebe korisnika za informacijama, one se formuliraju kao upit, koji predstavlja skup ključnih riječi koje karakteriziraju ono što korisnik traži.

Klasični zadatak IP-a, koji je započeo razvoj ovog područja, je traženje dokumenata koji zadovoljavaju upit unutar određene statičke zbirke dokumenata. No popis IP zadataka stalno se širi i sada uključuje:

  • Problemi modeliranja;
  • Filtriranje dokumenata;
  • Dizajniranje arhitekture tražilica i korisničkih sučelja;
  • Izdvajanje informacija, posebice bilješki i sažetak dokumenata;

Također, neki zadaci se postavljaju pred IP mehanizme za obradu prirodnih jezika, što uključuje morfološku analizu, rješavanje leksičke polisemije i tako dalje.

Ocjene učinkovitosti

Postoji mnogo načina za procjenu koliko dobro dokumenti koje je pronašao IPS odgovaraju upitu. Nažalost, koncept stupnja podudarnosti upita, ili drugim riječima relevantnosti, subjektivan je koncept, a stupanj podudarnosti ovisi o konkretnoj osobi koja ocjenjuje rezultate upita.

Preciznost

Na ovoj slici relevantne točke (rel) nalaze se lijevo od ravne linije, a točke koje pronalazi tražilica (retr) su u ovalu. Područja u crvenoj boji predstavljaju pogreške tražilice. Crveno područje s lijeve strane su relevantne točke koje sustav nije pronašao (događaj koji nedostaje), crveno područje s desne strane je pronađeno, ali nevažne točke (lažni alarm). Točnost je udio lijeve zelene površine u odnosu na oval (horizontalna strelica). potpunost je udio lijevog zelenog područja i površine lijevo od ravne linije (dijagonalna strelica).

Definira se kao omjer broja relevantnih dokumenata koje je pronašao IPS i ukupnog broja pronađenih dokumenata:

,

gdje je skup relevantnih dokumenata u bazi podataka, a skup dokumenata pronađenih od strane sustava. Prema rezultatima istraživanja tvrtke koja ocjenjuje relevantnost pokazatelja glavnih ruskih i stranih tražilica.

Potpunost (poziv)

Omjer brojeva pronađeno relevantnih dokumenata na ukupan broj relevantnih dokumenata u bazi podataka:

,

gdje je skup relevantnih dokumenata u bazi podataka, a skup dokumenata pronađenih od strane sustava.

Ispasti

Ispadanje karakterizira vjerojatnost pronalaska nerelevantnog resursa i definira se kao omjer broja pronađenih irelevantnih dokumenata i ukupnog broja nerelevantnih dokumenata u bazi podataka:

,

gdje je skup ne relevantnih dokumenata u bazi podataka, i - skup dokumenata pronađenih od strane sustava.

F-mjera (F-mjera, Van Riesbergenova mjera)

Ponekad je korisno kombinirati preciznost i prisjećanje u jedan prosjek. U tu svrhu aritmetička sredina nije prikladna, jer je, na primjer, dovoljno da tražilica vrati sve dokumente općenito kako bi se osiguralo opoziv jednak jedinici s točnošću blizu nule, a aritmetička sredina od preciznost i opoziv bit će najmanje 1/2. Harmonička sredina nema ovaj nedostatak, jer se s velikom razlikom u prosječnim vrijednostima približava minimalnoj od njih.

Stoga je dobra mjera za zajedničku procjenu točnosti i opoziva F-mjera, što je definirano kao ponderirana harmonijska sredina točnosti P i potpunost R:

Obično F- mjera je upisana u obrascu

Na bilo kojem F-mjera daje jednaku težinu preciznosti i opozivu i zove se uravnotežen ili - mjera(u donjem indeksu uobičajeno je označiti vrijednost), izraz za to je pojednostavljen

Korištenje uravnoteženog F-mjere su izborne: prednost se daje točnosti, a s većom težinom dobiva se cjelovitost.

vidi također

  • Ruski seminar o evaluaciji metoda pretraživanja informacija (ROMIP)

Bilješke

Linkovi

Književnost

  • Baeza-Yates R., Ribeiro-Neto B. Moderno pretraživanje informacija. - Addison-Wesley, 1999. - ISBN 0-201-39829-X
  • Manning C., Raghavan P., Schütze H. Uvod u pronalaženje informacija. - Cambridge University Press, 2008. - ISBN 0-521-86571-9
  • Manning K., Raghavan P., Schütze H. Uvod u pronalaženje informacija. - Williams, 2011. - ISBN 978-5-8459-1623-5
  • Lande D. V., Snarsky A. A., Bezsudnov I. V. Internetika: Navigacija po složenim mrežama: modeli i algoritmi. - M.: Librokom (Uvodnik URSS), 2009. - 264 str. - ISBN 978-5-397-00497-8

Zaklada Wikimedia. 2010 .

1. Uvod Svake godine obujam Interneta se višestruko povećava, pa se vjerojatnost pronalaženja potrebnih informacija dramatično povećava. Internet ujedinjuje milijune računala, mnogo različitih mreža, broj korisnika se povećava za 15-80% godišnje. Ipak, sve češće pri pristupu Internetu glavni problem nije nedostatak potrebnih informacija, već sposobnost pronalaženja. U pravilu, običan čovjek, zbog raznih okolnosti, ne može ili ne želi potrošiti više od 15-20 minuta tražeći odgovor koji mu je potreban. Stoga je posebno važno ispravno i kompetentno naučiti, čini se, jednostavnu stvar - gdje i kako tražiti da biste dobili ŽELJENE odgovore. Da biste pronašli informacije koje su vam potrebne, morate pronaći njegovu adresu. Za to postoje specijalizirani poslužitelji za pretraživanje (indeksni roboti (tražilice), tematski internetski imenici, meta-sustavi za pretraživanje, usluge pretraživanja ljudi itd.). Ova majstorska klasa otkriva glavne tehnologije za pretraživanje informacija na Internetu, pruža zajedničke značajke alata za pretraživanje, ispituje strukturu upita za pretraživanje najpopularnijih ruskih i engleskih tražilica. 2. Tehnologije pretraživanja World Wide Web (WWW) smatra se posebnom tehnologijom za pripremu i postavljanje dokumenata na Internet. WWW uključuje web stranice, elektroničke knjižnice, kataloge, pa čak i virtualne muzeje! S takvim obiljem informacija, oštro se postavlja pitanje: "Kako se kretati u tako velikom i velikom informacijskom prostoru?" U rješavanju ovog problema u pomoć priskaču alati za pretraživanje. 2.1 Alati za pretraživanje Alati za pretraživanje su poseban softver čija je glavna svrha pružiti najoptimalnije i najkvalitetnije pretraživanje informacija korisnicima Interneta. Alati za pretraživanje smješteni su na posebnim web poslužiteljima, od kojih svaki obavlja određenu funkciju:
  1. Analiza web stranica i unos rezultata analize na jednu ili drugu razinu baze podataka poslužitelja pretraživanja.
  2. Tražite informacije na zahtjev korisnika.
  3. Pružanje korisničkog sučelja za pretraživanje informacija i pregled rezultata pretraživanja od strane korisnika.
Metode rada koje se koriste pri radu s ovim ili drugim alatima za pretraživanje gotovo su iste. Prije nego što nastavite s raspravom o njima, razmotrite sljedeće koncepte:
  1. Sučelje alata za pretraživanje predstavljeno je kao stranica s hipervezama, nizom upita (stringom za pretraživanje) i alatima za aktivaciju upita.
  2. Indeks tražilice je informacijska baza koja sadrži rezultate analize web stranica, sastavljenih prema određenim pravilima.
  3. Upit je ključna riječ ili fraza koju korisnik unese u traku za pretraživanje. Posebni znakovi ("", ~), matematički simboli (*, +, ?) koriste se za formiranje različitih upita.
Shema pretraživanja informacija je jednostavna. Korisnik upisuje ključnu frazu i aktivira pretragu, čime dobiva odabir dokumenata prema formuliranom (zadanom) zahtjevu. Ovaj popis dokumenata rangiran je prema određenim kriterijima tako da se na vrhu liste nalaze oni dokumenti koji najviše odgovaraju upitu korisnika. Svaki od alata za pretraživanje koristi različite kriterije za rangiranje dokumenata, kako u analizi rezultata pretraživanja tako i pri formiranju indeksa (punjanju indeksne baze web stranica). Stoga, ako navedete upit istog dizajna u nizu za pretraživanje za svaki alat za pretraživanje, možete dobiti različite rezultate pretraživanja. Za korisnika je od velike važnosti koji će se dokumenti prema rezultatima pretraživanja pojaviti u prvih dva-tri desetaka dokumenata i u kojoj mjeri ti dokumenti odgovaraju korisnikovim očekivanjima. Većina alata za pretraživanje nudi dva načina pretraživanja - jednostavno pretraživanje (jednostavno pretraživanje) i napredno pretraživanje (napredno pretraživanje) sa i bez posebnog obrasca za upit. Razmotrimo obje vrste pretraživanja na primjeru tražilice na engleskom jeziku. Na primjer, AltaVista je korisna za proizvoljne upite, "Nešto o online diplomama u informacijskoj tehnologiji", dok Yahoo alat za pretraživanje omogućuje dobivanje vijesti iz svijeta, informacije o tečaju ili vremensku prognozu. Ovladavanje kriterijima za pročišćavanje upita i naprednim tehnikama pretraživanja omogućuje vam povećanje učinkovitosti pretraživanja i brzo pronalaženje potrebnih informacija. Prije svega, možete povećati učinkovitost pretraživanja korištenjem logičkih operatora (operacija) Ili, I, Near, Not, matematičkih i posebnih simbola u upitima. Uz pomoć operatora i/ili simbola, korisnik povezuje ključne riječi u željenom nizu kako bi dobio najprikladniji rezultat pretraživanja za upit. Obrasci zahtjeva prikazani su u tablici 1. Tablica 1

Jednostavan upit daje niz poveznica na dokumente, jer popis uključuje dokumente koji sadrže jednu od riječi unesenih na zahtjev ili jednostavnu frazu (vidi tablicu 1). Operator i omogućuje vam da odredite da sve ključne riječi trebaju biti uključene u sadržaj dokumenta. Međutim, broj dokumenata još uvijek može biti velik i može potrajati dugo za njihovo pregledavanje. Stoga je u nekim slučajevima mnogo prikladnije koristiti operator bliskog konteksta, koji označava da bi riječi trebale biti smještene u dovoljnoj blizini u dokumentu. Korištenje blizu uvelike smanjuje broj pronađenih dokumenata. Prisutnost simbola "*" u nizu upita znači da će se riječ tražiti po svojoj maski. Na primjer, dobijmo popis dokumenata koji sadrže riječi koje počinju s "gov" ako napišemo "gov*" u nizu upita. To mogu biti riječi vlada, guverner itd.

1. Uvod

Svake godine obujam Interneta se višestruko povećava, pa se vjerojatnost pronalaženja potrebnih informacija dramatično povećava. Internet ujedinjuje milijune računala, mnogo različitih mreža, broj korisnika se povećava za 15-80% godišnje. Ipak, sve češće pri pristupu Internetu glavni problem nije nedostatak potrebnih informacija, već sposobnost pronalaženja. U pravilu, običan čovjek, zbog raznih okolnosti, ne može ili ne želi potrošiti više od 15-20 minuta tražeći odgovor koji mu je potreban. Stoga je posebno važno ispravno i kompetentno naučiti, čini se, jednostavnu stvar - gdje i kako tražiti da biste dobili ŽELJENE odgovore.

Da biste pronašli informacije koje su vam potrebne, morate pronaći njegovu adresu. Za to postoje specijalizirani poslužitelji za pretraživanje (indeksni roboti (tražilice), tematski internetski imenici, meta-sustavi za pretraživanje, usluge pretraživanja ljudi itd.). Ova majstorska klasa otkriva glavne tehnologije za pretraživanje informacija na Internetu, pruža zajedničke značajke alata za pretraživanje, ispituje strukturu upita za pretraživanje najpopularnijih tražilica na ruskom i engleskom jeziku.

2. Tehnologije pretraživanja

Web-tehnologija World Wide Web (WWW) smatra se posebnom tehnologijom za pripremu i postavljanje dokumenata na Internet. WWW uključuje web stranice, elektroničke knjižnice, kataloge, pa čak i virtualne muzeje! S takvim obiljem informacija, oštro se postavlja pitanje: "Kako se kretati u tako velikom i velikom informacijskom prostoru?"
U rješavanju ovog problema u pomoć priskaču alati za pretraživanje.

2.1 Alati za pretraživanje

Alati za pretraživanje su poseban softver čija je glavna svrha pružiti najoptimalnije i najkvalitetnije pretraživanje informacija korisnicima Interneta. Alati za pretraživanje smješteni su na posebnim web poslužiteljima, od kojih svaki obavlja određenu funkciju:

  1. Analiza web stranica i unos rezultata analize na jednu ili drugu razinu baze podataka poslužitelja pretraživanja.
  2. Tražite informacije na zahtjev korisnika.
  3. Pružanje korisničkog sučelja za pretraživanje informacija i pregled rezultata pretraživanja od strane korisnika.

Metode rada koje se koriste pri radu s ovim ili drugim alatima za pretraživanje gotovo su iste. Prije nego što nastavite s raspravom o njima, razmotrite sljedeće koncepte:

  1. Sučelje alata za pretraživanje predstavljeno je kao stranica s hipervezama, nizom upita (stringom za pretraživanje) i alatima za aktivaciju upita.
  2. Indeks tražilice je informacijska baza koja sadrži rezultate analize web stranica, sastavljenih prema određenim pravilima.
  3. Upit je ključna riječ ili fraza koju korisnik unese u traku za pretraživanje. Posebni znakovi ("", ~), matematički simboli (*, +, ?) koriste se za formiranje različitih upita.

Shema za traženje informacija na Internetu je jednostavna. Korisnik upisuje ključnu frazu i aktivira pretragu, čime dobiva odabir dokumenata prema formuliranom (zadanom) zahtjevu. Ovaj popis dokumenata rangiran je prema određenim kriterijima tako da se na vrhu liste nalaze oni dokumenti koji najviše odgovaraju upitu korisnika. Svaki od alata za pretraživanje koristi različite kriterije za rangiranje dokumenata, kako u analizi rezultata pretraživanja tako i pri formiranju indeksa (punjanju indeksne baze web stranica).

Dakle, ako navedete upit istog dizajna u nizu za pretraživanje za svaki alat za pretraživanje, možete dobiti različite rezultate pretraživanja. Za korisnika je od velike važnosti koji će se dokumenti prema rezultatima pretraživanja pojaviti u prvih dva-tri desetaka dokumenata i u kojoj mjeri ti dokumenti odgovaraju korisnikovim očekivanjima.

Većina alata za pretraživanje nudi dva načina pretraživanja − jednostavno pretraživanje(jednostavna pretraga) i napredna pretraga(napredna pretraga) sa i bez obrasca za poseban zahtjev. Razmotrimo obje vrste pretraživanja na primjeru tražilice na engleskom jeziku.

Na primjer, AltaVista je korisna za proizvoljne upite, "Nešto o online diplomama u informacijskoj tehnologiji", dok Yahoo alat za pretraživanje omogućuje dobivanje vijesti iz svijeta, informacije o tečaju ili vremensku prognozu.

Svladavanje kriterija za pročišćavanje upita i naprednih tehnika pretraživanja omogućuje vam povećanje učinkovitosti pretraživanja i brzo pronalaženje potrebnih informacija. Prije svega, možete povećati učinkovitost pretraživanja korištenjem logičkih operatora (operacija) Ili, I, Near, Not, matematičkih i posebnih simbola u upitima. Uz pomoć operatora i/ili simbola, korisnik povezuje ključne riječi u željenom nizu kako bi dobio najprikladniji rezultat pretraživanja za upit. Obrasci zahtjeva prikazani su u tablici 1.

stol 1

Jednostavan upit daje niz poveznica na dokumente, jer popis uključuje dokumente koji sadrže jednu od riječi unesenih na zahtjev ili jednostavnu frazu (vidi tablicu 1). Operator i omogućuje vam da odredite da sve ključne riječi trebaju biti uključene u sadržaj dokumenta. Međutim, broj dokumenata još uvijek može biti velik i može potrajati dugo za njihovo pregledavanje. Stoga je u nekim slučajevima mnogo prikladnije koristiti operator bliskog konteksta, koji označava da bi riječi trebale biti smještene u dovoljnoj blizini u dokumentu. Korištenje blizu uvelike smanjuje broj pronađenih dokumenata. Prisutnost simbola "*" u nizu upita znači da će se riječ tražiti po svojoj maski. Na primjer, dobijmo popis dokumenata koji sadrže riječi koje počinju s "gov" ako napišemo "gov*" u nizu upita. To mogu biti riječi vlada, guverner itd.

Jednako popularna tražilica Rambler održava statistiku prometa veza iz vlastite baze podataka, isti logički operatori AND, OR, NOT, metaznak * (slično znaku * u AltaVisti koji proširuje raspon upita), simboli koeficijenta + i - su podržano za povećanje ili smanjenje značajnih riječi unesenih u upit.

Pogledajmo najpopularnije tehnologije pretraživanja informacija na Internetu.

2.2 Tražilice

Web tražilice su poslužitelji s ogromnom bazom podataka URL-ova koji automatski pristupaju WWW stranicama na svim tim adresama, ispituju sadržaj tih stranica, formiraju i upisuju ključne riječi sa stranica u njihovu bazu podataka (indeks stranice).

Štoviše, roboti tražilica prate poveznice na koje naiđu na stranicama i ponovno ih indeksiraju. Budući da gotovo svaka WWW stranica ima mnogo poveznica na druge stranice, takvim radom tražilica u krajnjem rezultatu teoretski može zaobići sve stranice na Internetu.

Upravo je ova vrsta alata za pretraživanje najpoznatija i najpopularnija među svim korisnicima interneta. Svi znaju imena poznatih web tražilica (tražilica) - Yandex, Rambler, Aport.

Da biste koristili ovu vrstu alata za pretraživanje, trebate otići do njega i u traku za pretraživanje upisati ključnu riječ koja vas zanima. Zatim ćete dobiti izlaz od poveznica pohranjenih u bazi podataka tražilice koje su najbliže vašem upitu. Kako bi pretraga bila što učinkovitija, unaprijed obratite pozornost na sljedeće točke:

  • odlučiti o temi zahtjeva. Što točno na kraju tražite?
  • obratiti pozornost na jezik, gramatiku, korištenje raznih neabecednih znakova, morfologiju.Također, važno je pravilno formulirati i unijeti ključne riječi. Svaka tražilica ima svoj oblik postavljanja zahtjeva - princip je isti, ali korišteni simboli ili operatori mogu se razlikovati. Potrebni obrasci zahtjeva također se razlikuju ovisno o složenosti softvera tražilice i uslugama koje pružaju. Na ovaj ili onaj način, svaka tražilica ima odjeljak "Pomoć" ("Pomoć"), gdje su na pristupačan način objašnjena sva pravila sintakse, kao i preporuke i savjeti za pretraživanje (screenshot stranica tražilice).
  • koristiti mogućnosti različitih tražilica. Ako ga ne možete pronaći na Yandexu, pokušajte s Googleom. Koristite napredne usluge pretraživanja.
  • da biste isključili dokumente koji sadrže određene pojmove, upotrijebite znak "-" ispred svake takve riječi. Na primjer, ako želite informacije o djelima Shakespearea, s izuzetkom "Hamleta", onda unesite upit u obliku: "Shakespeare-Hamlet". A kako biste osigurali da su određene veze nužno uključene u rezultate pretraživanja, koristite simbol "+". Dakle, da biste pronašli poveznice o prodaji automobila konkretno, potreban vam je upit "prodaja + auto". Da biste povećali učinkovitost i točnost pretraživanja, koristite kombinacije ovih znakova.
  • svaka poveznica na popisu rezultata pretraživanja sadrži - nekoliko redaka iz pronađenog dokumenta, među kojima su i vaše ključne riječi. Prije nego kliknete na vezu, procijenite relevantnost isječka za temu zahtjeva. Nakon što kliknete na vezu do određene stranice, pažljivo pogledajte glavnu stranicu. U pravilu je prva stranica dovoljna da shvatite jeste li došli na adresu ili ne. Ako da, izvršite daljnja pretraživanja potrebnih informacija na odabranoj stranici (u odjeljcima stranice), ako ne, vratite se na rezultate pretraživanja i pokušajte sljedeću vezu.
  • zapamtite da tražilice ne proizvode neovisne informacije (osim objašnjenja o sebi). Tražilica je samo posrednik između vlasnika informacije (web stranice) i Vas. Baze se stalno ažuriraju, u njih se unose nove adrese, ali i dalje ostaje zaostatak od informacija koje stvarno postoje u svijetu. Jednostavno zato što tražilice ne rade brzinom svjetlosti.

Najpoznatije web tražilice uključuju Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Među govornicima ruskog jezika mogu se izdvojiti Yandex, Rambler, Aport.

Tražilice su najveći i najvrjedniji, ali daleko od jedinih izvora informacija na webu, jer osim njih postoje i drugi načini pretraživanja interneta.

2.3 Imenici

Katalog internetskih resursa je hijerarhijski katalog koji se neprestano ažurira i nadopunjuje, a sadrži mnoge kategorije i pojedinačne web poslužitelje s kratkim opisom njihovog sadržaja. Metoda pretraživanja kataloga podrazumijeva „pomicanje niz stepenice“, odnosno pomicanje od općenitijih kategorija na one konkretnije. Jedna od prednosti tematskih imenika je da objašnjenja veza daju kreatori imenika i u potpunosti odražavaju njegov sadržaj, odnosno daje vam mogućnost da točnije odredite kako sadržaj poslužitelja odgovara namjeni. Vaše pretrage.

Primjer tematskog kataloga na ruskom jeziku je resurs http://www.ulitka.ru/.

Na glavnoj stranici ove stranice nalazi se tematski rubrikator,

uz pomoć kojih korisnik ulazi u rubriku s poveznicama na proizvode koji ga zanimaju.

Osim toga, neki imenici predmeta omogućuju pretraživanje po ključnim riječima. Korisnik unese željenu ključnu riječ u traku za pretraživanje

i prima popis poveznica s opisima stranica koje najviše odgovaraju njegovom zahtjevu. Treba napomenuti da se ova pretraga ne odvija u sadržaju WWW-poslužitelja, već u njihovom kratkom opisu pohranjenom u imeniku.

U našem primjeru, imenik također ima mogućnost sortiranja stranica prema broju posjeta, abecednim redom, prema datumu unosa.

Drugi primjeri imenika na ruskom jeziku:
[email protected]
Weblist
Vsego.ru
Među imenicima na engleskom jeziku su:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Zbirke poveznica

Zbirke veza veze su poredane po temi. Međusobno se sadržajno dosta razlikuju, pa da biste pronašli izbor koji najbolje odgovara vašim interesima, morate ih sami prošetati kako biste formirali svoje mišljenje.

Kao primjer, dat ćemo izbor linkova "Blago Interneta" JSC "Relcom"

Korisnik, klikom na bilo koji od odjeljaka koji ga zanima

  • SADRŽAJ

    Za vozače

    • Astronomija i astrologija
    • Tvoj dom
    • Vaši kućni ljubimci
    • Djeca su cvijeće života
    • Slobodno vrijeme
    • Gradovi na internetu
    • Zdravlje i medicina
    • Informacijske agencije i usluge
    • zavičajni muzej itd.,
    • Automobilska elektronika.
    • Muzej antičkog automobila.
    • Odbor za pravnu zaštitu vlasnika automobila.
    • sportski pogon.

    Prednost ove vrste alata za pretraživanje je njihova usmjerenost, obično odabir uključuje rijetke internetske resurse, odabrane od strane određenog webmastera ili vlasnika web stranice.

    2.5 Adresne baze podataka

    Adresne baze podataka su posebni poslužitelji za pretraživanje koji obično koriste klasifikacije prema vrsti aktivnosti, prema proizvodima i uslugama koje se pružaju te zemljopisnom području. Ponekad se nadopunjuju pretraživanjem po abecedi. Zapisi baze podataka pohranjuju informacije o stranicama koje daju informacije o adresi e-pošte, organizaciji i poštanskoj adresi uz naknadu.

    Najveća baza podataka adresa na engleskom jeziku može se nazvati: http://www.lookup.com/ -

    Ulazeći u ove poddirektorije, korisnik pronalazi poveznice na stranice koje nude informacije koje ga zanimaju.

    Široko dostupne i službene baze podataka adresa u Ruskoj Federaciji su nam nepoznate.

    2.6 Pretraživanje Gopher arhiva

    Gopher je međusobno povezani sustav poslužitelja (Gopher space) distribuiran preko Interneta.

    Najbogatija književna biblioteka sakupljena je u prostoru Gopher, ali materijali nisu dostupni za daljinsko gledanje: korisnik može samo pregledati hijerarhijski organizirani sadržaj i odabrati datoteku po naslovu. Uz pomoć posebnog programa (Veronica) takva se pretraga može izvršiti automatski pomoću upita na temelju ključnih riječi.

    Do 1995. Gopher je bio najdinamičnija internetska tehnologija: stopa rasta broja povezanih poslužitelja nadmašila je stopu rasta poslužitelja svih drugih vrsta interneta. U mreži EUnet/Relcom Gopher poslužitelji nisu dobili aktivan razvoj, a danas ih se gotovo nitko ne sjeća.

    2.7 FTP sustav pretraživanja datoteka (FTP pretraga)

    FTP tražilica datoteka posebna je vrsta internetske tražilice koja vam omogućuje pronalaženje datoteka dostupnih na "anonimnim" FTP poslužiteljima. FTP protokol je dizajniran za prijenos datoteka preko mreže, te je u tom smislu funkcionalno svojevrsni analog Gophera.

    Glavni kriterij pretraživanja je naziv datoteke naveden na različite načine (točno podudaranje, podniz, regularni izraz, itd.). Ova vrsta pretraživanja, naravno, ne može se natjecati s tražilicama u smislu mogućnosti, budući da se sadržaj datoteka ni na koji način ne uzima u obzir tijekom pretraživanja, a datotekama, kao što znate, mogu se dati proizvoljna imena. Međutim, ako trebate pronaći neki dobro poznati program ili standardni opis, tada će s velikim stupnjem vjerojatnosti datoteka koja ga sadrži imati odgovarajući naziv, a možete ga pronaći pomoću jednog od FTP poslužitelja za pretraživanje:

    FileSearch traži datoteke na FTP poslužiteljima prema nazivima samih datoteka i direktorija. Ako tražite program ili nešto drugo, onda ćete na WWW-poslužiteljima najvjerojatnije pronaći njihov opis, a s FTP-poslužitelja ih možete preuzeti sebi.

    2.8 Tražilica u Usenet konferencijama za vijesti

    USENET NEWS je sustav za telekonferencije internetske zajednice. Na Zapadu se ova usluga naziva vijestima. Bliski analog telekonferencija su takozvani "odjeci" u FIDO mreži.

    Sa stajališta pretplatnika na telekonferenciju, USENET je oglasna ploča koja ima odjeljke u kojima možete pronaći članke o svemu, od politike do vrtlarstva. Ova oglasna ploča dostupna je putem računala, slično e-pošti. Bez napuštanja računala, možete čitati ili objavljivati ​​članke na određenoj konferenciji, pronaći korisne savjete ili se pridružiti raspravama. Naravno, artikli zauzimaju prostor na računalima, pa se ne pohranjuju zauvijek, već se povremeno uništavaju, stvarajući mjesta za nove. U cijelom svijetu, najbolja usluga za pronalaženje informacija na Usenet konferencijama je poslužitelj Google Grupa (Google Inc.).

    Google Grupe je besplatna online zajednica i usluga grupa za raspravu koja nudi najveću arhivu Usenet poruka na Internetu (više od milijardu poruka). Za više informacija o uvjetima korištenja usluge posjetite http://groups. google.com/intl/ru /googlegroups/tour/index.html

    Među onima koji govore ruski ističu se poslužitelj USENET World System i telekonferencije Relcom. Kao iu drugim uslugama pretraživanja, korisnik upisuje upitni niz, a poslužitelj generira popis konferencija koje sadrže ključne riječi. Zatim se morate pretplatiti na odabrane konferencije u informativnom programu. Postoji i sličan ruski FidoNet Online poslužitelj: Fido konferencije na WWW-u.

    2.9 Meta sustavi pretraživanja

    Za brzo pretraživanje u bazama podataka nekoliko tražilica odjednom, bolje je obratiti se meta-sustavima pretraživanja.

    Meta tražilice su tražilice koje šalju vaš upit velikom broju različitih tražilica, zatim obrađuju rezultate, uklanjaju duple adrese resursa i predstavljaju širi raspon onoga što je predstavljeno na Internetu.

    Najpopularnija meta tražilica na svijetu je Search.com.

    Unificirana tražilica Search.com tvrtke CNET, Inc. uključuje gotovo dvadesetak tražilica, poveznice na koje su prepune cijelog Interneta.

    Koristeći ovu vrstu alata za pretraživanje, korisnik može tražiti informacije u raznim tražilicama, ali negativnu stranu ovih sustava možemo nazvati njihovom nestabilnošću.

    2.10 Sustavi za pretraživanje ljudi

    Sustavi za pretraživanje ljudi su posebni poslužitelji koji vam omogućuju pretraživanje ljudi na Internetu, korisnik može odrediti puno ime. osobu i dobiti njezinu adresu e-pošte i URL. Međutim, treba napomenuti da tražilice za ljude općenito preuzimaju informacije o adresama e-pošte iz otvorenih izvora, kao što su Usenet forumi. Među najpoznatijim sustavima za pretraživanje ljudi su:

    Pronalaženje e-mail adresa

    u posebnim poljima za pretraživanje za kontakt podatke (Ime. Grad, Prezime, Broj telefona) možete pronaći informacije koje vas zanimaju.

    Tražilice za ljude stvarno su veliki poslužitelji, njihove baze podataka sadrže oko 6.000.000 adresa.

    3. Zaključak

    Pregledali smo glavne tehnologije za pretraživanje informacija na Internetu i općenito predstavili alate za pretraživanje koji trenutno postoje na Internetu, kao i strukturu upita za pretraživanje za najpopularnije tražilice na ruskom i engleskom jeziku, te, sumirajući gore navedeno, želimo napomenuti da jedinstvena optimalna shema traženja informacija na Internetu ne postoji. Ovisno o specifičnim informacijama koje trebate, možete koristiti odgovarajuće alate za pretraživanje i usluge. A kvaliteta rezultata pretraživanja ovisi o tome koliko su kompetentno odabrane usluge pretraživanja.

  • Internet raste gigantskom brzinom i nije lako pronaći informacije koje su potrebne određenom korisniku. Ali moguće je, jer mreža ima resurse koji će pomoći i početniku i profesionalcu da se ne utopi u oceanu informacija.

    Pojava World Wide Weba postala je kvantitativni i kvalitativni skok u području informacijske tehnologije. Broj novih resursa i količina informacija koje oni sadrže rastu poput lavine, povećava se broj igala u informacijskom "plastu sijena" i, sukladno tome, veličina plasta sijena. Za traženje informacija na mreži dostupne su sljedeće vrste resursa:

    • - informacijski portali;
    • - katalozi internetskih izvora;
    • - tražilice.

    Sam internet se postupno pretvorio u masovni medij s ogromnom publikom korisnika diljem svijeta i nevjerojatnom količinom informacija. Postao je globalno informacijsko sredstvo koje je komunikacijskim kanalima zaplelo čitavu zemaljsku kuglu, ali nije apsorbiralo medije na koje smo navikli, već su se organski stopili u mrežu kao samostalni informacijski resursi. Gotovo svaka novina, radio postaja ili TV kanal u bilo kojoj zemlji na svijetu ima svoje predstavništvo na internetu.

    Elektronska verzija novina može i, u pravilu, vrlo se razlikuje od papirne verzije, znatno je premašujući po obimu - format podataka objavljenih na internetskim stranicama je fleksibilniji, nije ograničen samo na stranice dodijeljene za materijal , novinske i časopisne kolumne. Pojavljuje se element interaktivnosti - čitatelji mogu ostaviti svoje komentare i povratne informacije o pročitanom članku, vijestima i analitičkoj recenziji.

    Neki časopisi, poput TIMES-a, čak su digitalizirali arhivu novina tijekom cijelog postojanja, uključujući i godine kada još nije bilo računala ili računalnih mreža, međutim, pretraživanje takvih arhiva je plaćeno i prilično skupo.

    Najmjerodavniji i najprofesionalniji izvor operativnih informacija za korisnike Interneta i za medije su web resursi informacijskih agencija. Posjedujući široku dopisničku mrežu, dnevno i po satu, na internetu i putem elektroničkih komunikacijskih kanala, šire društveno-političke, gospodarske, znanstvene, financijske informacije.

    Alati za pretraživanje

    Alati za pretraživanje su poseban softver čija je glavna svrha pružiti najoptimalnije i najkvalitetnije pretraživanje informacija korisnicima Interneta. Alati za pretraživanje smješteni su na posebnim web poslužiteljima, od kojih svaki obavlja određenu funkciju:

    • 1. Analiza web stranica i unos rezultata analize na jednu ili drugu razinu baze podataka poslužitelja pretraživanja.
    • 2. Tražiti informacije na zahtjev korisnika.
    • 3. Pružanje korisničkog sučelja za pretraživanje informacija i pregled rezultata pretraživanja od strane korisnika.

    Metode rada koje se koriste pri radu s ovim ili drugim alatima za pretraživanje gotovo su iste. Prije nego što nastavite s raspravom o njima, razmotrite sljedeće koncepte:

    • 1. Sučelje alata za pretraživanje predstavljeno je kao stranica s hipervezama, nizom upita (stringom za pretraživanje) i alatima za aktivaciju upita.
    • 2. Indeks tražilice je informacijska baza koja sadrži rezultate analize web stranica, sastavljenih prema određenim pravilima.
    • 3. Upit je ključna riječ ili fraza koju korisnik unosi u traku za pretraživanje. Za formiranje različitih upita koriste se posebni znakovi ("", |, ~), matematički simboli (*, +, ?).

    Shema pretraživanja informacija je jednostavna. Korisnik upisuje ključnu frazu i aktivira pretragu, čime dobiva odabir dokumenata prema formuliranom (zadanom) zahtjevu. Ovaj popis dokumenata rangiran je prema određenim kriterijima tako da se na vrhu liste nalaze oni dokumenti koji najviše odgovaraju upitu korisnika. Svaki od alata za pretraživanje koristi različite kriterije za rangiranje dokumenata, kako u analizi rezultata pretraživanja tako i pri formiranju indeksa (punjanju indeksne baze web stranica).

    Dakle, ako navedete upit istog dizajna u nizu za pretraživanje za svaki alat za pretraživanje, možete dobiti različite rezultate pretraživanja. Za korisnika je od velike važnosti koji će se dokumenti prema rezultatima pretraživanja pojaviti u prvih dva-tri desetaka dokumenata i u kojoj mjeri ti dokumenti odgovaraju korisnikovim očekivanjima.

    Većina alata za pretraživanje nudi dva načina pretraživanja - jednostavno pretraživanje(jednostavna pretraga) i napredna pretraga(napredna pretraga) sa i bez obrasca za poseban zahtjev. Razmotrimo obje vrste pretraživanja na primjeru tražilice na engleskom jeziku.

    Na primjer, AltaVista je korisna za proizvoljne upite, "Nešto o online diplomama u informacijskoj tehnologiji", dok Yahoo alat za pretraživanje omogućuje dobivanje vijesti iz svijeta, informacije o tečaju ili vremensku prognozu.

    Svladavanje kriterija za pročišćavanje upita i naprednih tehnika pretraživanja omogućuje vam povećanje učinkovitosti pretraživanja i brzo pronalaženje potrebnih informacija. Prije svega, možete povećati učinkovitost pretraživanja korištenjem logičkih operatora (operacija) Ili, I, Near, Not, matematičkih i posebnih simbola u upitima. Uz pomoć operatora i/ili simbola, korisnik povezuje ključne riječi u željenom nizu kako bi dobio najprikladniji rezultat pretraživanja za upit.

    Jednostavan upit daje niz poveznica na dokumente, jer popis uključuje dokumente koji sadrže jednu od riječi unesenih na zahtjev ili jednostavnu frazu (vidi tablicu 1). Operator i omogućuje vam da odredite da sve ključne riječi trebaju biti uključene u sadržaj dokumenta. Međutim, broj dokumenata još uvijek može biti velik i može potrajati dugo za njihovo pregledavanje. Stoga je u nekim slučajevima mnogo prikladnije koristiti operator bliskog konteksta, koji označava da bi riječi trebale biti smještene u dovoljnoj blizini u dokumentu. Korištenje blizu uvelike smanjuje broj pronađenih dokumenata. Prisutnost simbola "*" u nizu upita znači da će se riječ tražiti po svojoj maski. Na primjer, dobijmo popis dokumenata koji sadrže riječi koje počinju s "gov" ako napišemo "gov*" u nizu upita. To mogu biti riječi vlada, guverner itd.

    Najrazvijeniju uslugu pretraživanja informacija na ruskom jeziku pruža poslužitelj za pretraživanje Yandex. U Yandexu možete jednostavno napisati na ruskom frazu koja opisuje što želite pronaći, a sustav će analizirati i obraditi vaš zahtjev, a zatim pokušati pronaći sve što se odnosi na određenu temu. Možete, koristeći posebne operatore, sastaviti niz koji objašnjava tražilici kakvi bi trebali biti vaši zahtjevi za informacijama koje vas zanimaju.

    Jednako popularna tražilica Rambler održava statistiku prometa veza iz vlastite baze podataka, isti logički operatori AND, OR, NOT, metaznak * (slično znaku * u AltaVisti koji proširuje raspon upita), simboli koeficijenta + i - su podržano za povećanje ili smanjenje značajnih riječi unesenih u upit.

    Najpopularnije tehnologije pretraživanja informacija na Internetu.

    Tehnologija pretraživanja informacija na Internetu. Vrste alata za pretraživanje

    1. Uvod

    2. Tehnologije pretraživanja

    2.1 Alati za pretraživanje

    2.2 Tražilice

    2.3 Imenici

    2.4 Zbirke poveznica

    2.5 Adresne baze podataka

    2.6 Pretraživanje Gopher arhiva

    2.7 FTP sustav pretraživanja datoteka (FTP pretraga)

    2.8 Tražilica u Usenet konferencijama za vijesti

    2.9 Meta sustavi pretraživanja

    2.10 Sustavi za pretraživanje ljudi

    3. Zaključak

    Dodatak . Kratke informacije o tražilicama

    1. Uvod

    Svake godine obujam Interneta se višestruko povećava, pa se vjerojatnost pronalaženja potrebnih informacija dramatično povećava.

    Internet ujedinjuje milijune računala, mnogo različitih mreža, broj korisnika se povećava za 15-80% godišnje. Pa ipak, sve više pri pristupu Internetu, glavni problem pokazalo se da nije nedostatak potrebnih informacija, alipriliku da ga pronađe. U pravilu, običan čovjek, zbog raznih okolnosti, ne može ili ne želi potrošiti više od 15-20 minuta tražeći odgovor koji mu je potreban. Stoga je posebno važno ispravno i kompetentno naučiti, čini se, jednostavnu stvar - gdje i kako tražiti da biste dobili ŽELJENE odgovore.

    Da biste pronašli informacije koje su vam potrebne, morate pronaći njegovu adresu. Za to postoje specijalizirani poslužitelji za pretraživanje (indeksni roboti (tražilice), tematski internetski imenici, meta-sustavi za pretraživanje, usluge pretraživanja ljudi itd.).

    Nadalje, otkrivaju se glavne tehnologije za traženje informacija na Internetu, daju se zajedničke značajke alata za pretraživanje i razmatraju se strukture upita pretraživanja za najpopularnije tražilice na ruskom i engleskom jeziku.

    2. Tehnologije pretraživanja

    Web-tehnologija World Wide Web (WWW) smatra se posebnom tehnologijom za pripremu i postavljanje dokumenata na Internet. WWW uključuje web stranice, elektroničke knjižnice, kataloge, pa čak i virtualne muzeje! S takvim obiljem informacija, oštro se postavlja pitanje: "Kako se kretati u tako velikom i velikom informacijskom prostoru?" Pomoć u rješavanju ovog problema alati za pretraživanje.

    2.1 Alati za pretraživanje

    Alati za pretraživanje su poseban softver čija je glavna svrha pružiti najoptimalnije i najkvalitetnije pretraživanje informacija korisnicima Interneta. Alati za pretraživanje smješteni su na posebnim web poslužiteljima, od kojih svaki obavlja određenu funkciju:

    1. Analiza web stranica i unos rezultata analize na jednu ili drugu razinu baze podataka poslužitelja pretraživanja.

    2. Tražite informacije na zahtjev korisnika.

    3. Pružanje korisničkog sučelja za pretraživanje informacija i pregled rezultata pretraživanja od strane korisnika.

    Metode rada koje se koriste pri radu s ovim ili drugim alatima za pretraživanje gotovo su iste.

    Prvo razmotrimo sljedeće koncepte:

    1. Sučelje alata za pretraživanje predstavljeno je kao stranica s hipervezama, nizom upita (stringom za pretraživanje) i alatima za aktivaciju upita.

    2. Indeks tražilice- Riječ je o informacijskoj bazi koja sadrži rezultate analize web stranica, sastavljenih prema određenim pravilima.

    3. Upit je ključna riječ ili fraza koju korisnik unosi u traku za pretraživanje. Za formiranje različitih upita koriste se posebni ("", ~ ) i matematički simboli (*, +, ?).

    Shema pretraživanja informacija je jednostavna. Korisnik upisuje ključnu frazu i aktivira pretragu, te na taj način dobiva odabir dokumenata prema formuliranom zahtjevu. Ovaj popis dokumenata rangiran je prema određenim kriterijima tako da se na vrhu liste nalaze oni dokumenti koji najviše odgovaraju upitu korisnika. Svaki od alata za pretraživanje koristi različite kriterije za rangiranje dokumenata, kako u analizi rezultata pretraživanja tako i pri formiranju indeksa (punjanju indeksne baze web stranica).

    Dakle, ako navedete upit istog dizajna u nizu za pretraživanje za svaki alat za pretraživanje, možete dobiti različite rezultate pretraživanja. Za korisnika je od velike važnosti koji će se dokumenti prema rezultatima pretraživanja pojaviti u prvih dva-tri desetaka dokumenata i u kojoj mjeri ti dokumenti odgovaraju korisnikovim očekivanjima.

    Većina alata za pretraživanje nudi dva načina pretraživanja - jednostavno pretraživanje (jednostavno pretraživanje) i napredno pretraživanje (napredno pretraživanje) pomoću posebnog obrasca zahtjeva i bez njega. Razmotrimo obje vrste pretraživanja na primjeru tražilice na engleskom jeziku.

    Na primjer, AltaVista je korisna za proizvoljne upite, " Nešto o online diplomama iz informacijske tehnologije“, dok Yahoo alat za pretraživanje omogućuje dobivanje svjetskih vijesti, informacija o tečaju ili vremenske prognoze.

    Svladavanje kriterija za pročišćavanje upita i naprednih tehnika pretraživanja omogućuje vam povećanje učinkovitosti pretraživanja i brzo pronalaženje potrebnih informacija. Prije svega, možete povećati učinkovitost pretraživanja korištenjem logičkih operatora (operacija) Ili ,I ,Near ,Not , matematičkih i posebnih simbola u upitima. Uz pomoć operatora i/ili simbola, korisnik povezuje ključne riječi u željenom nizu kako bi dobio najprikladniji rezultat pretraživanja za upit. Obrasci zahtjeva na engleskom jeziku. prikazani su u tabeli 1.

    stol 1

    Jednostavan zahtjev

    Napredni upit

    proširena

    koristeći matematičke

    simboli

    račun internetskog trgovca i

    Internet+ trgovac+ račun

    trgovački račun

    internet ~ trgovac~ gov*

    račun internet trgovca

    internet trgovac u blizini vlade*

    internet ~ trgovac~ guverner

    "trgovački račun"

    edukacija internetskih trgovaca

    Internet ~ trgovac~ (guverner

    "račun internetskog trgovca"

    Jednostavan upit daje niz poveznica na dokumente, jer popis uključuje dokumente koji sadrže jednu od riječi unesenih na zahtjev ili jednostavnu frazu (vidi tablicu 1). Operator i omogućuje vam da odredite da sve ključne riječi trebaju biti uključene u sadržaj dokumenta. Međutim, broj dokumenata još uvijek može biti velik i može potrajati dugo za njihovo pregledavanje. Stoga je u nekim slučajevima mnogo prikladnije koristiti operator bliskog konteksta, koji označava da bi riječi trebale biti smještene u dovoljnoj blizini u dokumentu. Korištenje blizu uvelike smanjuje broj pronađenih dokumenata. Prisutnost simbola "*" u nizu upita znači da će se riječ tražiti po svojoj maski. Na primjer, dobivamo popis dokumenata koji sadrže riječi koje počinju s "gov" ako napišemo "gov*" u nizu upita. To mogu biti riječi vlada, guverner itd.

    Najrazvijeniju uslugu pretraživanja informacija na ruskom jeziku pruža poslužitelj za pretraživanje Yandex.

    U Yandexu možete jednostavno napisati na ruskom frazu koja opisuje što želite pronaći, a sustav će analizirati i obraditi vaš zahtjev, a zatim pokušati pronaći sve što se odnosi na određenu temu.

    Možete, koristeći posebne operatore, sastaviti niz koji objašnjava tražilici kakvi bi trebali biti vaši zahtjevi za informacijama koje vas zanimaju. Neki od operatora jezika upita Yandexa mogu se pronaći ovdje: http://help.yandex.ru/search/?id=481939

    Jednako popularna tražilica Rambler održava statistiku prometa veza iz vlastite baze podataka, isti logički operatori AND, OR, NOT, metaznak * (slično znaku * u AltaVisti koji proširuje raspon upita), simboli koeficijenta + i - su podržano za povećanje ili smanjenje značajnih riječi unesenih u upit.

    Pogledajmo najpopularnije tehnologije pretraživanja informacija na Internetu.

    2.2 Tražilice

    Web tražilice su poslužitelji s ogromnom bazom podataka URL-ova koji automatski pristupaju WWW stranicama na svim tim adresama, ispituju sadržaj tih stranica, formiraju i upisuju ključne riječi sa stranica u njihovu bazu podataka (indeks stranice).

    Štoviše, roboti tražilica prate poveznice na koje naiđu na stranicama i ponovno ih indeksiraju. Budući da gotovo svaka WWW stranica ima mnogo poveznica na druge stranice, takvim radom tražilica u krajnjem rezultatu teoretski može zaobići sve stranice na Internetu.

    Upravo je ova vrsta alata za pretraživanje najpoznatija i najpopularnija među svim korisnicima interneta. Svi znaju imena poznatih web tražilica (tražilica) - Yandex,

    Rambler, Aport.

    Da biste koristili ovu vrstu alata za pretraživanje, trebate otići do njega i u traku za pretraživanje upisati ključnu riječ koja vas zanima.

    Za najučinkovitiju pretragu, unaprijed obratite pozornost na sljedeće točke:

    odlučiti o temi zahtjeva. Što točno na kraju tražite?

    obratiti pozornost na jezik, gramatiku, upotrebu raznih neabecednih znakova, morfologiju . Također je važno pravilno formulirati i unijeti ključne riječi. Svaka tražilica ima svoj oblik postavljanja zahtjeva - princip je isti, ali korišteni simboli ili operatori mogu se razlikovati. Potrebni obrasci zahtjeva također se razlikuju ovisno o složenosti softvera tražilice i uslugama koje pružaju. Na ovaj ili onaj način, svaka tražilica ima odjeljak " Pomozite "("Pomoć"), gdje su na pristupačan način objašnjena sva pravila sintakse, kao i preporuke i savjeti za pretraživanje (snimka zaslona stranica tražilice).

    koristiti mogućnosti različitih tražilica . Ako ga ne možete pronaći na Yandexu, pokušajte s Googleom. Koristite napredne usluge pretraživanja.

    da biste isključili dokumente koji sadrže određene pojmove, koristite znak "-" prije svake takve riječi. Na primjer, ako želite informacije o Shakespeareovim djelima, s izuzetkom Hamleta, unesite upit u obrazac: "Shakespeare-Hamlet". A kako biste osigurali da su određene veze uključene u rezultate pretraživanja, koristite simbol "+ ": veze o prodaji automobila konkretno - upit "prodaja + auto".

    svaka poveznica na popisu rezultata pretraživanja sadrži isječak - nekoliko redaka iz pronađenog dokumenta, među kojima su i vaše ključne riječi. Prije nego kliknete na vezu, procijenite relevantnost isječka za temu zahtjeva. Nakon što kliknete na vezu do određene stranice, pažljivo pogledajte glavnu stranicu. U pravilu je prva stranica dovoljna da shvatite jeste li došli na adresu ili ne. Ako da, izvršite daljnja pretraživanja potrebnih informacija na odabranoj stranici (u odjeljcima stranice), ako ne, vratite se na rezultate pretraživanja i pokušajte sljedeću vezu.

    zapamtite da tražilice ne proizvode neovisne informacije (osim objašnjenja o sebi). Sustav pretraživanja

    samo je posrednik između vlasnika informacija (web stranice) i vas. Baze se stalno ažuriraju, u njih se unose nove adrese, ali i dalje ostaje zaostatak od informacija koje stvarno postoje u svijetu. To je jednostavno zato što tražilice ne rade brzinom svjetlosti.

    Najpoznatije web tražilice uključuju Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Među govornicima ruskog jezika mogu se izdvojiti Yandex, Rambler, Aport.

    Tražilice su najveći i najvrjedniji, ali daleko od jedinih izvora informacija na webu.

    Udio: