Koje alate koristimo za rad i komunikaciju s korisnicima. Razvoj tražilica na ruskom jeziku


Nakon proučavanja ove teme naučit ćete i ponoviti:

Čemu služe poslužitelji za pretraživanje?
- imenovanje glavnih dijelova poslužitelja za pretraživanje;
- koje vrste pretraživanja informacija postoje na Internetu;
- osnovna pravila za generiranje zahtjeva u tražilici Yandex.

Pretraživanje po URL-ovima

Najbrži i najpouzdaniji način pronalaženja informacija na Internetu je pretraživanje URL-ova. Mnogi od njih dati su u tiskanim publikacijama, posebnim priručnicima, čuju se u eteru popularnih radio postaja i s TV ekrana.

♦ Navijači nogometnog kluba Zenit adresu www.fc-zenit.ru znaju napamet.
♦ Obožavateljima grupe "Korol i Shut" dobro je poznata službena stranica ove grupe www.korol.spb.ru.
♦ Ljubitelji kanala NTV mogu lako pronaći njegovu web stranicu na www.ntv.ru. Za brzi pristup gore navedenim resursima, samo pokrenite program preglednika, kao što je Internet Explorer, i upišite poznati URL u adresnu traku.

Tražilice

Internet je fokusiran veliki iznos dokumenata. Kako bi se olakšalo traženje potrebnih informacija, stvorene su posebne tražilice.

tražilice- Riječ je o automatskim sustavima koji anketiraju poslužitelje spojene na globalnu mrežu i u svoju bazu podataka pohranjuju informacije o dostupnim podacima na poslužiteljima. Prema posebno formuliranom zahtjevu, tražilice daju informacije o tome gdje možete dobiti potrebne podatke.

U pravilu, tražilice se sastoje od tri dijela: robot, program za indeksiranje i obradu zahtjeva.

Robot (pauk, robot ili bot) je program koji posjećuje web stranice i čita (u cijelosti ili djelomično) njihov sadržaj. Roboti tražilica razlikuju se po individualnoj shemi za analizu sadržaja web stranice.
Indeks tražilice- ovo je spremište slika za pretraživanje koje posjećuju stranice robota. Slika za pretraživanje dokumenta (uključujući web stranicu) je opis sadržaja dokumenta na posebnom jeziku za pretraživanje informacija. Ovaj opis sadrži kodove za ključne riječi dokumenta, odražavajući njegovo značenje i sadržaj. Indeksi u svakoj tražilici razlikuju se po količini i načinu na koji su informacije pohranjene. Baze podataka vodećih tražilica pohranjuju informacije o desecima milijuna dokumenata, a indeksi im se mjere stotinama gigabajta. Indeksi se povremeno ažuriraju i nadopunjuju, pa se rezultati rada jedne tražilice s istim upitom mogu razlikovati ako je pretraga izvršena u različito vrijeme.

Rukovatelj zahtjevima je program koji, sukladno zahtjevu korisnika, "traži" indeks prisutnosti potrebnih informacija i vraća poveznice na pronađene dokumente. Skup poveznica na izlazu iz sustava program distribuira u silaznom redoslijedu relevantnosti y, to jest od najvišeg stupnja podudaranja veze sa zahtjevom do najnižeg.

Trenutno su najpopularnije za ruske korisnike interneta tri glavne tražilice tipa indeksa:

Ovi sustavi uzimaju u obzir gramatičke značajke ruskog jezika, pa su rezultati njihova pretraživanja u resursima na ruskom jeziku kvalitetniji nego u zapadnim sustavima.

Tražilice se razlikuju po pokrivenosti izvorima informacija:

♦ opće tražilice imaju bazu podataka u svim područjima znanja i odlikuju se opsežnim indeksom i velikom količinom akumuliranih informacija;
♦ tražilice posebne namjene pogledajte samo stranice o određenim temama, poput glazbe ili muzeja.

Glavne karakteristike tražilica su:

♦ obujam dokumenata u indeksu;
♦ učestalost ažuriranja informacija;
♦ informacijski prostor koji robot tražilice pokriva i raznolikost vrsta dokumenata o kojima se podaci prikupljaju;
♦ brzina obrade zahtjeva;
♦ kriterij za određivanje relevantnosti (podudarnost pronađenog dokumenta s upitom za pretraživanje);
♦ mogućnost detaljizacije i pojašnjenja zahtjeva.

Pretraživanje po rubrikatoru tražilice

Direktoriji za pretraživanje sustavna su zbirka (odabir) poveznica na druge internetske izvore. Veze su organizirane u obliku tematskog rubrikatora, koji je hijerarhijska struktura po kojoj možete pronaći informacije koje su vam potrebne.

Navedimo kao primjer strukturu internetskog kataloga pretraživanja Yandex. Ovo je katalog Opća namjena, budući da sadrži poveznice na internetske izvore u gotovo svim mogućim smjerovima. Ovaj katalog sadrži sljedeće teme:

♦ Poslovanje i ekonomija;
♦ Reference i poveznice;
♦ Društvo i politika;
♦ Dom i obitelj;
♦ Znanost i obrazovanje;
♦ Zabava i rekreacija;
♦ Računala i komunikacije;
♦ Kultura i umjetnost.

Svaka tema uključuje mnoge pododjeljke, a oni zauzvrat sadrže rubrike, i tako dalje.

Pretpostavimo da pripremate događaj za Dan pobjede i želite na internetu pretražiti riječi poznate vojne pjesme Bulata Okudzhave "Čuješ kako čizme tutnjaju". Pretraga se može organizirati na sljedeći način: Yandex Katalog Kultura i umjetnost Glazba Autorska pjesma.

Ova metoda pretraživanja prilično je brza i učinkovita. Na kraju vam se nudi samo 5 linkova, među kojima se nalaze i linkovi na stranice s pjesmama poznatih bardova. Ostaje samo pronaći na web mjestu arhivu s tekstovima B. Okudzhave i odabrati željeni tekst u njoj.

Još jedan primjer. Pretpostavimo da ćete kupiti mobitel i žele usporediti karakteristike uređaja različitih tvrtki. Pretraživanje se može provesti pod sljedećim naslovima kataloga: Yandex Katalog Računala i komunikacije mobilna veza Mobiteli.

Nakon što dobijete ograničeni broj referenci, možete ih brzo pregledati i odabrati telefon pregledavajući karakteristike po tvrtkama i modifikacijama uređaja.

Pretraživanje po ključnim riječima

Većina tražilica ima mogućnost pretraživanja po ključnim riječima. Ovo je jedna od najčešćih vrsta pretraživanja. Za pretraživanje po ključnim riječima potrebno je u poseban prozor unijeti riječ ili više riječi za pretraživanje i kliknuti na gumb Traži. Tražilica će u svojoj bazi podataka pronaći i prikazati dokumente koji sadrže te riječi. Takvih dokumenata može biti mnogo, ali puno u ovom slučaju ne znači nužno i dobro.

Provedimo neke eksperimente s bilo kojom tražilicom. Pretpostavimo da odlučimo pokrenuti akvarij i zanimaju nas sve informacije o ovoj temi.

Na prvi pogled najjednostavnije je tražiti riječ "akvarij". Provjerimo to, na primjer, u tražilici Yandex. Rezultat pretraživanja bit će više od 460.000 stranica na 3.500 stranica - ogroman broj poveznica. Štoviše, ako bolje pogledate, među njima će biti mjesta koja spominju grupu B. Grebenshchikova "Akvarij", trgovački centri i neformalne udruge s istim imenom, i još mnogo toga, nevezano za akvarijske ribe.

Lako je pogoditi da takva pretraga ne može zadovoljiti ni nepretencioznog korisnika. Previše vremena trebat će potrošiti na odabir među svim predloženim dokumentima onih koji se odnose na temu koja nam je potrebna, a još više na upoznavanje njihovog sadržaja.

Odmah možemo zaključiti da najčešće nije preporučljivo pretraživati ​​po jednoj riječi jer je vrlo teško po jednoj riječi odrediti temu dokumenta, web stranice ili stranice. Izuzetak su rijetke riječi i pojmovi koji se gotovo nikada ne koriste izvan svog područja.

Pokušajmo razjasniti uvjete pretraživanja i unijeti izraz "akvarijske ribe". Rezultat pretraživanja bit će nešto više od 20.000 stranica i oko 650 stranica. Kao što vidite, broj poveznica se smanjio za više od 20 puta. Ovaj rezultat nam više odgovara, ali svejedno, među predloženim vezama možete sresti, na primjer, ruske setove suvenira naljepnica za šibice sa slikama riba, i zbirke čuvara zaslona za radnu površinu računala, i kataloge akvarijskih riba s fotografijama, i akvarij prodavaonice pribora.

Očito je da se trebamo nastaviti kretati u smjeru usavršavanja uvjeta pretraživanja.

Kako bi pretraživanje bilo produktivnije, sve tražilice imaju poseban jezik za upite s vlastitom sintaksom. Ovi su jezici na mnogo načina slični. Učenje svih njih prilično je teško, ali svaka tražilica ima sustav pomoći koji će vam omogućiti da svladate željeni jezik.

Evo deset jednostavnih pravila za generiranje zahtjeva u tražilici Yandex.

1. Ključne riječi u upitu treba pisati malim (malim) slovima. To će osigurati da se pretražuju sve ključne riječi, a ne samo one koje počinju velikim slovom.

2. Pretraživanje uzima u obzir sve oblike riječi prema pravilima ruskog jezika, bez obzira na oblik riječi u upitu. Na primjer, ako je riječ "znati" navedena u upitu, tada će riječi "znati", "znati" itd. također zadovoljiti uvjet pretraživanja.

3. Da biste tražili stabilnu frazu, trebate staviti riječi u navodnike, na primjer, "porculansko posuđe".

4. Za pretraživanje po točnom obliku riječi morate ispred riječi staviti uskličnik. Na primjer, da biste tražili riječ "rujan" u genitivu, napisali biste "!rujan".

5. Za pretraživanje unutar jedne rečenice, riječi u upitu su odvojene razmakom ili znakom &: "avanturistički roman" ili "avantura i roman". Nekoliko riječi unesenih u upitu, odvojenih razmacima, znači da sve moraju biti uključene u jednu rečenicu dokumenta koji se traži.

6. Ako želite odabrati samo one dokumente u kojima se pojavljuje svaka riječ navedena u upitu, stavite znak plus "+" ispred svakog od njih. Ako, naprotiv, želite isključiti bilo koju riječ iz rezultata pretraživanja, stavite minus "-" ispred te riječi. Znakovi "+" i "-" moraju biti napisani s razmakom od prethodne i spojeni sa sljedećom riječi. Na primjer, upit "Volga-car" će pronaći dokumente koji sadrže riječ "Volga", a ne riječ "auto".

7. Kada tražite sinonime ili riječi bliske po značenju, između riječi možete staviti okomitu crtu "|". Na primjer, za upit "dijete | klinac | baby" će pronaći dokumente s bilo kojom od ovih riječi.

8. Umjesto jedne riječi u upitu, možete zamijeniti cijeli izraz. Da biste to učinili, mora se staviti u zagrade, na primjer "(dijete | beba | djeca | beba) + (skrb | odgoj)".

9. Znak *~" (tilda) omogućuje vam pronalaženje dokumenata s rečenicom koja sadrži prvu riječ, ali ne sadrži drugu. Na primjer, pretraga "knjige ~ trgovina" pronaći će sve dokumente koji sadrže riječ "knjige" a pored koje (unutar rečenice) nema riječi "trgovina".

10. Ako se operator jednom ponovi (na primjer, & ili ~), pretraga se vrši unutar rečenice. Dvostruki operator (&&, -) pretražuje unutar dokumenta. Na primjer, upit "rak - astrologija" će pronaći dokumente s riječju "rak" koji nisu povezani s astrologijom.

Imajući određeni skup najčešćih pojmova u željenom području, možete koristiti napredno pretraživanje. Na sl. 3.3 prikazuje prozor naprednog pretraživanja u Yandex tražilici. U ovom načinu rada, mogućnosti jezika upita implementirane su kao obrazac. Sličnu uslugu, uključujući filtre rječnika, nude gotovo sve tražilice.

Riža. 3.3. Primjer naprednog pretraživanja u sustavu Yandex

Pod uvjetom pravi izbor poželjnih i potrebnih riječi te isključivanje nepoželjnih pojmova takvo pretraživanje može dati dobre rezultate.

Vratimo se primjeru akvarijskih ribica. Nakon čitanja nekoliko dokumenata koje nudi tražilica, postaje jasno da potraga za informacijama na internetu ne bi trebala započeti s izborom akvarijskih riba. Akvarij - kompleks biološki sustav, čije stvaranje i održavanje zahtijeva posebno znanje, vrijeme i ozbiljna ulaganja.

Na temelju dobivenih informacija, osoba koja vrši pretraživanje na Internetu može radikalno promijeniti strategiju daljnjeg pretraživanja, odlučivši se za proučavanje posebne literature koja se odnosi na problematiku koja se proučava.

Za pretraživanje literature ili dokumenata s punim tekstom moguć je sljedeći upit:

"+ (akvarij | akvarist | akvarist) + za početnike + (savjet | literatura) + (članak | diplomski rad | cijeli tekst) - (cijena | trgovina | dostava | katalog)".

Nakon obrade zahtjeva od strane tražilice dobiven je sljedeći rezultat: stranica - 195, stranica - najmanje 43.

Kao što se vidi iz statistike pretraživanja, rezultat je bio vrlo uspješan. Već prvi linkovi vode do potrebnih dokumenata:

Postavljanje akvarija > Savjeti za akvariste početnike >
Članci > Aq uascope. hr
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) - stroga usklađenost.
SAVJETI AKVARISTIMA POČETNICIMA. Kako odabrati i postaviti akvarij, kako...
http://www.aquariums.ru/sovna.htm (2KB) 23.07.2002 - nestriktna korespondencija.

Sada možete sažeti rezultate pretrage, izvući određene zaključke i odlučiti o mogućim radnjama:

♦ Prestanite s daljnjom potragom, jer iz raznih razloga održavanje akvarija nije u vašoj moći.
♦ Pročitajte predložene članke i počnite postavljati akvarij.
♦ Potražite materijale o hrčcima ili valovitim papagajima.

Profesionalna pretraga

Istraživači i stručnjaci morat će promišljenije pristupiti organizaciji potrage. Prilikom profesionalnog traženja informacija na Internetu moraju biti ispunjeni sljedeći uvjeti:

♦ velika brzina pretraživanja;
♦ pouzdanost primljenih informacija;
♦ cjelovitost obuhvata izvora tijekom pretraživanja.

Ubrzati. Brzina pretraživanja ovisi uglavnom o dva čimbenika: o kompetentnom planiranju pretraživanja (odabir usluga i alata za pretraživanje) i vještinama rada s već odabranim resursom (sposobnost brzog razumijevanja njegove strukture i načina navigacije). Indeksi pretraživanja nisu dovoljni da osiguraju brzinu pretraživanja. Osim njih, na Internetu postoji niz resursa za pretraživanje čijom se upotrebom osigurava obavljanje profesionalnog pretraživanja.

Pouzdanost. Pitanje pouzdanosti informacija primljenih s interneta vrlo je važno, jer svatko može tamo postaviti bilo koju informaciju bez ikakve kontrole njihove usklađenosti sa stvarnošću. To pak dovodi do velikog broja nepouzdanih izvora, kao što su sažeci i seminarski radovi preplavivši internet.

Postoje posebne usluge pretraživanja koje vam omogućuju procjenu pouzdanosti izvora informacija na Internetu.

Potpunost. Nužan uvjet za uspješno prikupljanje informacija u punom opsegu je poznavanje glavnih vrsta resursa koji danas postoje i korištenje različitih usluga pretraživanja. Nijedna tražilica ne može pokriti sve izvore interneta.

U pravilu, da bi se postigao pozitivan rezultat, korisnik mora pribjeći uslugama nekoliko tražilica. Možete to učiniti sami, prelazeći sa sustava na sustav, ili možete taj posao povjeriti nekom od metapretraživača (meta je prvi komponenta složene riječi, označavajući sustave za opis i proučavanje drugih sustava).

Riža. 3.4. Prozori za metapretraživanje

Metatražilice nemaju vlastite baze podataka za pretraživanje i prilikom pretraživanja koriste resurse mnogih drugih tražilica. Zbog toga je vjerojatnost pronalaska potrebnih informacija vrlo velika. Rad u sustavima metapretraživanja odvija se prema istim pravilima kao i rad u tražilicama. To je zbog činjenice da su metatražilice svojevrsni dodaci tražilicama i u svom radu koriste njihove indeksne baze podataka. Izgled metapretraživača sliči izgled poznate tražilice. Na sl. 3.4 prikazuje prozore metapretraživača myweb.ru i metabot.ru.

Iskustvo pokazuje da u većini slučajeva najbolji rezultat postići korištenjem više nezavisnih indeksa pretraživanja nego korištenjem jedne metatražilice.

Kontrolna pitanja i zadaci

1. Koja je svrha programa preglednika?

2. Koje programe preglednika poznajete?

3. Gdje korisnik koji planira internetsko pretraživanje može pronaći URL-ove?

4. Koja je tehnologija pretraživanja za rubrikator tražilice?

5. Što je tehnologija pretraživanja ključnih riječi?

6. Koji se zahtjevi moraju poštovati u profesionalnom traženju informacija na internetu?

7. Kada je potrebno navesti znak "+" ili "-" u kriteriju pretraživanja?

8. Koji su kriteriji pretraživanja u Yandexu postavljeni sljedećom frazom:

(dadilja | učitelj | guvernanta) ++ (skrb | odgoj | nadzor).

9. Što znači udvostručenje znaka (∼∼ ili ++) kod formiranja složenog upita?

10. Što je relevantnost pretraživanja?

11. Koja je svrha metapretraživača?

Tehnologije pretraživanja

Zakoni trenja i prijenosa topline i mase u turbulentnom graničnom sloju

Postoji nekoliko verzija prikaza ʼʼzakona trenjaʼʼ (za referentni slučaj), što dovodi do gotovo identičnih rezultata. U skladu s konceptom ʼʼlogaritamskogʼʼ graničnog sloja (s vrijednošću prve konstante turbulencije χ = 0,4) zakon trenja za iznimno razvijenu turbulenciju s ʼʼviskoznošću koja nestajeʼʼ dobro je aproksimirana jednostavnom Karmanovom formulom:

S potencijskim prikazom profila brzine treba predložiti formulu:

gdje: ; n je eksponent profila brzine;

– poluempirijski koeficijent;

ALI– empirijski koeficijent;

δ je debljina graničnog sloja.

Koristeći relacije za Reynoldsove brojeve izgrađene na različitim linearnim veličinama:

Važno je napomenuti da za slučaj razvoja turbulentnog graničnog sloja od prednjeg ruba ( x cr = 0) zakon trenja također se mora predstaviti kao:

Vrijednosti parametarskih vrijednosti prikazanih formula za različite profile brzine sažete su u tablici

Parametar n
1/7 1/8 1/9 1/10
ALI 8,74 9,71 10,6 11,5
0,0975 0,089 0,0818 0,0757
1,28 1,25 1,22 1,20
m 0,250 0,222 0,200 0,182
B 0,0252 0,0206 0,0190 0,0148
m 1 0,200 0,182 0,167 0,154
B1 0,0576 0,0450 0,0362 0,0308

Također su poznati i korišteni i drugi oblici prikaza zakona trenja koji dovode do praktički istih rezultata. Tako je V.M. Ievlev je predložio aproksimaciju:

Formule za zakone prijenosa topline i mase dobivene su iz ʼʼzakona trenjaʼʼ za standardne uvjete (referentni slučaj) pomoću dobro poznatog principa Reynoldsove trostruke analogije.

gdje: S– faktor korekcije – faktor Reynoldsove analogije za neusklađenost s uvjetima standarda(a), faktor S u prvoj aproksimaciji se zadovoljavajuće aproksimira relacijom:

Važno je napomenuti da su za slučaj korištenja integralnih parametara ʼʼzakoniʼʼ prijenosa topline i mase dobro opisani ovisnostima:

Web-tehnologija World Wide Web (WWW) smatra se posebnom tehnologijom za pripremu i postavljanje dokumenata na Internet. WWW uključuje web stranice, elektroničke knjižnice, kataloge, pa čak i virtualne muzeje! Uz ovoliku količinu informacija, oštro se postavlja pitanje: ʼʼ Kako se snaći u tako velikom i velikom informacijskom prostoru -ʼʼ Alati za pretraživanje priskaču u pomoć u rješavanju ovog problema.

Alati za pretraživanje su posebni softver, čija je glavna svrha omogućiti najoptimalnije i najkvalitetnije pretraživanje informacija za korisnike Interneta. Alati za pretraživanje nalaze se na posebnim web poslužiteljima, od kojih svaki obavlja određenu funkciju:

1. Analiza web stranica i unos rezultata analize na jednu ili drugu razinu baze podataka poslužitelja za pretraživanje.

2. Pretraživanje informacija na zahtjev korisnika.

3. Pružanje korisničkog sučelja za pretraživanje informacija i pregledavanje rezultata pretraživanja od strane korisnika.

Metode rada koje se koriste pri radu s ovim ili drugim alatima za pretraživanje gotovo su iste. Prije nego što nastavite s njihovom raspravom, razmotrite sljedeće koncepte:

1. Sučelje alata za pretraživanje predstavljeno je kao stranica s hipervezama, nizom upita (niz za pretraživanje) i alatima za aktivaciju upita.

2. Indeks tražilice - ϶ᴛᴏ baza podataka koja sadrži rezultate analize web stranica, sastavljene prema određenim pravilima.

3. Upit - ϶ᴛᴏ ključna riječ ili fraza koju korisnik unosi u traku za pretraživanje. Za formiranje raznih upita koriste se posebni znakovi ("", ~), matematički simboli (*, +, -).

Shema pretraživanja informacija je jednostavna. Korisnik upisuje ključnu frazu i aktivira pretragu, čime dobiva izbor dokumenata prema formuliranom (zadanom) zahtjevu. Ovaj popis dokumenata je rangiran prema određenim kriterijima tako da se na vrhu popisa nalaze oni dokumenti koji najviše odgovaraju korisnikovom upitu. Svaki od alata za pretraživanje koristi različite kriterije za rangiranje dokumenata, kako u analizi rezultata pretraživanja, tako i u formiranju indeksa (popunjavanje baze indeksa web stranica).

Dakle, ako navedete isti upit u nizu za pretraživanje za svaki alat za pretraživanje, možete dobiti različite rezultate pretraživanja. Za korisnika je od velike važnosti koji će se dokumenti pojaviti u prvih dva ili tri tuceta dokumenata prema rezultatima pretraživanja i u kojoj mjeri ti dokumenti odgovaraju očekivanjima korisnika.

Većina alata za pretraživanje nudi dva načina pretraživanja − jednostavno pretraživanje(jednostavno pretraživanje) i napredno pretraživanje(napredno pretraživanje) sa i bez posebnog obrasca zahtjeva. Razmotrimo obje vrste pretraživanja na primjeru tražilice na engleskom jeziku.

Na primjer, AltaVista je korisna za proizvoljne upite, ʼʼNešto o online diplomama iz informacijske tehnologijeʼʼ, dok Yahoo alat za pretraživanje omogućuje dobivanje svjetskih vijesti, informacije o tečaju ili vremensku prognozu.

Ovladavanje kriterijima za preciziranje upita i naprednim tehnikama pretraživanja omogućuje povećanje učinkovitosti pretraživanja i brzo pronalaženje potrebnih informacija. Prije svega, možete povećati učinkovitost pretraživanja korištenjem logičkih operatora (operacija) Or, And, Near, Not, matematičkih i posebnih simbola u upitima. Uz pomoć operatora i/ili simbola, korisnik povezuje ključne riječi u željenom nizu kako bi dobio najprikladniji rezultat pretraživanja za upit. Jednostavan upit vraća mali broj referenci na dokumente, jer popis uključuje dokumente koji sadrže jednu od riječi unesenih tijekom upita ili jednostavnu frazu (vidi tablicu 1). Operator and omogućuje vam da navedete da sve ključne riječi trebaju biti uključene u sadržaj dokumenta. Međutim, broj dokumenata bi i dalje trebao biti velik i trebat će dosta vremena za njihov pregled. Zbog toga je u nekim slučajevima mnogo prikladnije koristiti operator bliskog konteksta, koji označava da se riječi trebaju nalaziti dovoljno blizu u dokumentu. Korištenje blizu uvelike smanjuje broj pronađenih dokumenata. Prisutnost simbola "*" u nizu upita znači da će se riječ tražiti po maski. Na primjer, uzmimo popis dokumenata koji sadrže riječi koje počinju s "gov", ako napišemo "gov*" u nizu upita. To su riječi vlada, guverner itd.

Najrazvijeniju uslugu pretraživanja informacija na ruskom jeziku pruža poslužitelj za pretraživanje Yandex. U Yandexu možete jednostavno napisati na ruskom frazu koja opisuje ono što želite pronaći, a sustav će analizirati i obraditi vaš zahtjev, a zatim pokušati pronaći sve što se odnosi na zadanu temu. Pomoću posebnih operatora možete sastaviti niz koji tražilici objašnjava kakvi bi trebali biti vaši zahtjevi za informacijama koje vas zanimaju. Neki od operatora Yandex jezika upita mogu se pronaći ovdje: http://help.yandex.ru/search/ -id=481939

Jednako popularna tražilica Rambler vodi statistiku prometa linkova iz vlastite baze podataka, podržava iste logičke operatore AND, OR, NOT, metakarakter * (sličan znaku * u AltaVisti koji proširuje raspon upita), koeficijente simbole + i - , za povećanje ili smanjenje važnosti riječi unesenih u upit.

Pogledajmo najpopularnije tehnologije pretraživanja informacija na internetu.

Tema 3 Rad s internetskim tražilicama

Alati za pretraživanje

Alati za pretraživanje su posebni programi čija je glavna svrha korisnicima Interneta omogućiti najoptimalnije i najkvalitetnije pretraživanje informacija. Alati za pretraživanje nalaze se na posebnim web poslužiteljima, od kojih svaki obavlja određenu funkciju:

1. Analiza web stranica i unos rezultata analize na jednu ili drugu razinu baze podataka poslužitelja za pretraživanje.

2. Pretraživanje informacija na zahtjev korisnika.

3. Pružanje korisničkog sučelja za pretraživanje informacija i pregledavanje rezultata pretraživanja od strane korisnika.

Metode rada koje se koriste pri radu s ovim ili drugim alatima za pretraživanje gotovo su iste. Prije nego što nastavite s njihovom raspravom, razmotrite sljedeće koncepte:

1. Sučelje alata za pretraživanje predstavljeno je kao stranica s hipervezama, nizom upita (niz za pretraživanje) i alatima za aktivaciju upita.

2. Indeks tražilice je informacijska baza koja sadrži rezultat analize web stranica, sastavljena prema određenim pravilima.

3. Upit je ključna riječ ili fraza koju korisnik unosi u traku za pretraživanje. Za formiranje raznih upita koriste se posebni znakovi ("", ~), matematički simboli (*, +, ?).

Shema pretraživanja informacija je jednostavna. Korisnik upisuje ključnu frazu i aktivira pretragu, čime dobiva izbor dokumenata prema formuliranom (zadanom) zahtjevu. Ovaj popis dokumenata je rangiran prema određenim kriterijima tako da se na vrhu popisa nalaze oni dokumenti koji najviše odgovaraju korisnikovom upitu. Svaki od alata za pretraživanje koristi različite kriterije za rangiranje dokumenata, kako u analizi rezultata pretraživanja, tako i u formiranju indeksa (popunjavanje baze indeksa web stranica).

Stoga, ako navedete upit istog dizajna u nizu za pretraživanje za svaki alat za pretraživanje, možete dobiti različite rezultate pretraživanja. Za korisnika je od velike važnosti koji će se dokumenti pojaviti u prvih dva ili tri tuceta dokumenata prema rezultatima pretraživanja i u kojoj mjeri ti dokumenti odgovaraju očekivanjima korisnika.

Većina alata za pretraživanje nudi dva načina pretraživanja − jednostavno pretraživanje(jednostavno pretraživanje) i napredno pretraživanje(napredno pretraživanje) sa i bez posebnog obrasca zahtjeva. Razmotrimo obje vrste pretraživanja na primjeru tražilice na engleskom jeziku.

Na primjer, AltaVista je korisna za proizvoljne upite, "Nešto o online diplomama iz informacijske tehnologije", dok Yahooov alat za pretraživanje omogućuje dobivanje svjetskih vijesti, tečajeva ili vremenske prognoze.

Ovladavanje kriterijima za preciziranje upita i naprednim tehnikama pretraživanja omogućuje povećanje učinkovitosti pretraživanja i brzo pronalaženje potrebnih informacija. Prije svega, možete povećati učinkovitost pretraživanja korištenjem logičkih operatora (operacija) Or, And, Near, Not, matematičkih i posebnih simbola u upitima. Uz pomoć operatora i/ili simbola, korisnik povezuje ključne riječi u željenom nizu kako bi dobio najprikladniji rezultat pretraživanja za upit. Obrasci zahtjeva prikazani su u tablici 1.

stol 1

Jednostavan upit daje niz poveznica na dokumente, jer popis uključuje dokumente koji sadrže jednu od riječi unesenih na zahtjev ili jednostavnu frazu (vidi tablicu 1). Operator and omogućuje vam da navedete da sve ključne riječi trebaju biti uključene u sadržaj dokumenta. Međutim, broj dokumenata još uvijek može biti velik i njihovo pregledavanje može potrajati dugo. Stoga je u nekim slučajevima mnogo prikladnije koristiti operator bliskog konteksta, koji označava da se riječi trebaju nalaziti dovoljno blizu u dokumentu. Korištenje blizu uvelike smanjuje broj pronađenih dokumenata. Prisutnost simbola "*" u nizu upita znači da će se riječ tražiti po maski. Na primjer, uzmimo popis dokumenata koji sadrže riječi koje počinju s "gov" ako napišemo "gov*" u nizu upita. To mogu biti riječi vlada, guverner itd.

Najrazvijeniju uslugu pretraživanja informacija na ruskom jeziku pruža poslužitelj za pretraživanje Yandex. U Yandexu možete jednostavno napisati na ruskom frazu koja opisuje ono što želite pronaći, a sustav će analizirati i obraditi vaš zahtjev, a zatim pokušati pronaći sve što se odnosi na zadanu temu. Pomoću posebnih operatora možete sastaviti niz koji tražilici objašnjava kakvi bi trebali biti vaši zahtjevi za informacijama koje vas zanimaju.

Jednako popularna tražilica Rambler vodi statistiku posjećenosti linkova iz vlastite baze podataka, isti logički operatori AND, OR, NOT, metakarakter * (sličan znaku * u AltaVisti koji proširuje raspon upita), koeficijenti simboli + i - su podržava povećanje ili smanjenje značaja riječi unesenih u upit.

Pogledajmo najpopularnije tehnologije pretraživanja informacija na internetu.

Postavljanje informacijskih izvora.

Alati za pretraživanje izvora informacija.

Trenutačno se internetski informacijski resursi razvijaju velikom brzinom. World Wide Web nalikuje čitaonici knjižnice, gdje su pohranjene ogromne količine teksta, grafike, multimedije, arhiva i drugih datoteka. Ovu dvoranu nije moguće u potpunosti zaobići. Ovdje se sve mijenja iz sata u sat, tijelo raznih dokumenata raste svake sekunde. Pronalaženje potrebnih informacija postaje sve teže. Razni tiskani priručnici zastarijevaju i prije nego što se objave. Jedini pouzdani način pronalaska informacija je korištenje posebnih tražilica koje neprestano prate promjene informacija na mreži.

Resursi koji se koriste na Internetu najčešće se nalaze na stranicama WWW poslužitelja (ili Web poslužitelja), u arhivama datoteka (FTP arhive), te u informacijsko-referentnom sustavu Gopher.

WWW (World Wide Web - Svjetska mreža) je globalni hipertekstualni sustav koji koristi HTTP protokol (HyperText Transfer protocol - protokol za prijenos hiperteksta) za prijenos informacija na Internetu. Hipertekst je način predstavljanja svih vrsta informacija u obliku niza čvorova koji su međusobno povezani asocijativnom (a ne sekvencijalnom) vezom i implementirani kao hiperveze. Hiperveza - niz znakova istaknutih u hipertekstu koji reagira na klik mišem i šalje korisnika na drugi fragment hiperteksta. Većina dokumenata pohranjenih na web poslužitelju napisana je u HTML-u (HyperText Markup Language).

Gopher poslužitelj je poslužitelj koji sadrži programe koji vam omogućuju pronalaženje datoteka, programa ili drugih resursa o temi koju odredi korisnik. URL za takav poslužitelj izgleda ovako (ako je poslužitelj u vlasništvu Microsofta, na primjer): gopher://gopher.microsoft.com.

Postoje dvije skupine alata za pretraživanje: 1) tražilice i 2) usluge pretraživanja.

IPS (sustav za pronalaženje informacija) - to je sustav koji omogućuje pretraživanje i odabir potrebnih podataka u posebnoj bazi podataka s opisima izvora informacija ( indeks ) na temelju jezika za pronalaženje informacija i odgovarajućih pravila pretraživanja.

Na Internetu se mogu razlikovati sljedeći alati za pretraživanje WWW-a: tražilice, metatražilice (tražilice) i programi za ubrzano pretraživanje (tražilice).


sl.13. WWW alati za pretraživanje

Ovisno o tome tko kreira baze podataka u kojima se pretražuju informacije potrebne korisniku, postoje tražilice prve i druge vrste. U tražilicama prve vrste baze podataka stvaraju ljudi, u tražilicama druge vrste taj proces provodi računalo.


Tražilice prve vrste, u pravilu, nazivaju se katalozi (predmetno ili tematsko - predmetni katalozi). Obično takve imenike stvaraju ljudi u obliku hijerarhijskih stabala, na čijoj se najvišoj razini nalazi najviše opći pojmovi: biznis, politika, obrazovanje, sport, kultura itd. Elementi donje razine takvih stabala su veze na određene web stranice i poslužitelje. Obično se pretraživanja u predmetnim katalozima provode po ključnim riječima. . U ovom slučaju, ne drži se u sadržaju web poslužitelja, već u njihovom kratki opisi pohranjeni u imeniku. Zahtjev za pretraživanje formira se ili kao popis ključnih riječi ("informacijska tehnologija", "računalna lingvistika" itd.) ili navođenjem URL-ova dokumenata koji se pretražuju. Rezultati pretraživanja prikazuju se u obliku hiperteksta koji sadrži nazive ili URL-ove pronađenih dokumenata kao hipertekstualne veze.

Sljedeće informacije možete pretraživati ​​po ključnim riječima:

1) neki tekst ili njegov dio;

2) činjenične podatke (na primjer, masa sunca ili ime predsjednika zemlje);

3) slike, crteži, filmovi i sl. po njihovim imenima;

4) tehnički podaci (na primjer, podaci o brzini određenog automobila);

5) biografije ljudi (pisci, umjetnici i dr.).

Primjeri tematskih imenika su Yahoo, Galaxy, WWW virtualna knjižnica, WebCrawler, HotBot itd. Sličan sustav na ruskom jeziku zove se Pathfinder.

Ponekad se nazivaju tražilice druge vrste automatski indeksi, "pauci" ili "crvi" pauci, puzavci). Neprestano skeniraju internet, pronalaze nove dokumente na webu i iz svakog dokumenta izdvajaju sve hiperveze koje se u njemu nalaze, čime nadopunjuju svoje baze podataka (baze URL-ova). Kako bi obavljao te funkcije, automatski indeks uključuje sljedeća tri dijela: bot koji neprestano pregledava internet; baza podataka (skup URL-ova) koju prikuplja robot i korisničko sučelje za pretraživanje potrebnih informacija u toj bazi podataka. Postoji veliki broj automatskih indeksa. Najpopularniji su:

Strane tražilice:

- Altavista (http://www.altavista.com);

- Go (Infoseek) (http://www.go.com);

- Google (http://www.google.com);

- Excite (http://www.excite.com);

- HotBot (http://www.hotbot.com);

- Sjeverno svjetlo (http://www.northernlight.com).

Ruske tražilice:

- Yandex (http://www.yandex.ru);

- Rambler (http://www.rambler.ru);

- Aport (http://www.aport.ru).
Popularne bjeloruske tražilice:

- ALL.BY sustav (http://all.by);

- *.BY sustav (http://search.promedia.minsk.by);

- Registar bjeloruskih WWW-resursa Zubr (http://www.zubr.com);

- Bjeloruski internetski katalog Akavita (http://akavita.kryvia.net);

- Katalog bjeloruskih izvora (http://www.belresource.com.by),

Većina tražilica jedan je od sastavnih dijelova višenamjenskih internetskih web stranica – tzv. portala.

Portal- višenamjenska internetska stranica koja nudi razne usluge: pretraživanje informacija, besplatnu e-poštu itd.

Nedavno su se na World Wide Webu počeli pojavljivati ​​sustavi koji automatski pretražuju u dva indeksa odjednom (kataloški indeks i indeks tražilice). Takvi sustavi omogućuju vam da iskoristite obje vrste poslužitelja za pretraživanje i tzv imenici strojeva.

Traženje informacija pomoću različitih alata za pretraživanje može se provoditi formiranjem jednostavnih i složenih upita. Jednostavan upit je riječ ili izraz koji se ponekad nalazi u navodnicima. Složeni upit formira se od riječi ili fraza povezanih operatorima kao što su AND, OR, NOT, NEAR ili matematičkim simbolima, kao što su "*", "+", "-", "~". Ponekad se za iste svrhe koriste posebni pojmovi. domena, host, plima veze i tako dalje.

Video upute: Kako kreirati zahtjeve u Microsoftov pristup za 10 minuta

Predavanje: Korištenje alata tražilice (generiranje upita)

Najvažnije funkcije pri radu s bazama podataka su filtar informacija, pretraživanje i upit.


Sortiranje je proces sređivanja informacija prema nekom atributu. Postoje uzlazne i silazne vrste. Ako baza podataka ima numeričke podatke, tada se rangiranje koristi kao sortiranje, a ako pričamo o tekstualnim informacijama, koriste abecedno sortiranje.


Kada se razmatra sortiranje prema sustavima za upravljanje bazom podataka u MS Accessu, sortiranje se provodi unutar jednog polja. Ako se koristi novo sortiranje, njegovi prethodni rezultati se gube. Ako je sortiranje ugniježđeno, tada se to može učiniti pomoću upita.


filtar je izbor informacija koje su potrebne korisniku. Možete postaviti složene uvjete odabira.

Da biste pronašli neke podatke, možete koristiti posebne znakove tzv maska:


* – znači da se može odabrati bilo koji broj znakova.

? - umjesto ovog znaka može stajati bilo koji znak koji je dopušten za korištenje.

# - umjesto ovog simbola može se koristiti bilo koji broj.

- bilo koji znakovi u zagradama.

- – bilo koji znak koji odgovara odabranom rasponu.

! – bilo koji znak, osim onih u uglastim zagradama.

Ovaj filter po predznacima može se koristiti za cijelu tablicu ili za dio podataka koji su već odabrani prema nekom kriteriju.

Zahtjev- ova funkcija je široka i može uključivati ​​sortiranje i filtriranje. Ova značajka omogućuje odabir podataka u više polja i tablica. Možete stvoriti biblioteku upita koja se sprema za buduću upotrebu. Postoji poseban SQL upitni jezik – strukturirani.

Udio: