Osnove iskanja s spletnimi iskalniki

Splet je vsak dan bolj obširen in vse težje se je znajti v njem. Zato se bomo tokrat ukvarjali s tem, kako na spletu najdemo stran, ki nas zanima. Pri tem so nam v veliko pomoč iskalniki, ki dan in noč brskajo po spletu ter ustvarjajo katalog njegove vsebine. V tokratnem izboru meseca si bomo ogledali skupne značilnosti večjih iskalnikov in nakazali morebitne razlike med njimi. Na koncu bomo — na nekoliko drugačen način kot ponavadi — opisali deset iskalnikov, ki nam pomagajo znajti se v nepregledni množici obstoječih spletnih strani in poiskati želeno informacijo.
Oglejmo si torej OSNOVE ISKANJA S SPLETNIMI ISKALNIKI.

NASLOV STRANI (URL)
Vsaka datoteka na spletu ima svoj naslov ali URL (angl. Universal Resource Locator), ki je videti približno takole:
<I>http://www.javornik-drustvo.si/Drustvo/Predstavitev.html<I>
Prvi del (<I>http://<I>) pomeni, da iščemo datoteke, dostopne prek hipertekstnega protokola. Drugi del, ki je postavljen med dvojno poševnico in naslednjo poševnico (v našem primeru <I>www.javornik-drustvo.si<I>) je ime računalnika oziroma strežnika, na katerem se stran nahaja. Ostanek naslova strani pomeni imenike, podimenike in ime datoteke. Če ime datoteke izpustimo in navedemo samo imenik, nam bo strežnik ponudil privzeto datoteko za določeni imenik. Ker nekateri strežniki za določene imenike tega ne dovoljujejo, v takem primeru javijo napako. Če ne podamo niti imenika niti imena datoteke, nam bo strežnik posredoval svojo osnovno stran.

ISKANJE PO NASLOVU STRANI
Do datoteke na spletu najlažje pridemo, če poznamo njen točni naslov. Kako pridemo do nje? Preprosto: v naslovno vrstico brskalnika (najbolj razširjena brskalnika sta Netscape Navigator in Internet Explorer) vpišemo naslov (URL) in pritisnemo ENTER. Brskalnik se odpravi na vpisani naslov in nam prikaže datoteko, ki se tam nahaja. Namesto v naslovno vrstico lahko naslov vpišemo tudi z ustreznim menijskim ukazom. V Netscape Navigatorju izberemo File/Open Page, vpišemo naslov in pritisnemo gumb Open, v Internet Explorerju pa izberemo File/Open, vpišemo naslov in pritisnemo gumb OK. Ukazni vrstici omenjenih brskalnikov prikazuje spodnja slika. Odpiranje strani neposredno preko naslova je najpreprostejši način doseganja datoteke in pravzaprav niti ne zasluži imena iskanje.

KAJ PA, ČE NASLOVA STRANI NE POZNAMO?
Če naslova datoteke ne poznamo, se moramo iskanja lotiti drugače. Pravzaprav gre le v tem primeru za pravo iskanje. Včasih sem nam zgodi, da smo stran, ki jo želimo videti, že obiskali, a smo pozabili njen naslov, spomnimo pa se približno, kaj na njej piše. Včasih se moramo iskanja lotiti popolnoma od začetka, saj želimo poiskati kakšno stran z določeno tematiko, ki je še nismo obiskali. Takrat nam na pomoč priskočijo iskalniki, ki nenehno pregledujejo splet in si poskušajo zapomniti vsebino strani na pregledanih naslovih. V svojih podatkovnih zbirkah imajo shranjene velikanske količine informacij o pregledanih straneh, naša naloga pa je, da tako zbrane informacije čim bolje izkoristimo.
Iskalnikov je veliko, med najbolj znanimi pa so AltaVista, Excite, Go, Google, LookSmart, Lycos, Northern Light, WebCrawler, WebTop in Yahoo.
Recimo, da nas zanima astronomija in želimo poiskati astronomske spletne strani. Odpravimo se na iskalnik AltaVista. URL tega iskalnika je <I>http://www.altavista.com<I>, zato ga vpišemo v iskalno vrstico in pritisnemo ENTER. Vpisali bi lahko tudi samo <I>www.altavista.com<I>, saj je <I>http<I> privzet protokol spletnih brskalnikov. Nekateri brskalniki stran najdejo tudi, če vpišemo samo »altavista«, saj znajo po potrebi sami dodati <I>www<I> na začetku in <I>com<I> na koncu. Brskalnik nam prikaže glavno stran iskalnika AltaVista. V iskalno vrstico (v našem primeru rubrika »Search for:«) vnesemo besedo »astronomy« in pritisnemo gumb »Search« (išči). AltaVista nam postreže z množico strani z astronomsko vsebino in lahko si jih začnemo ogledovati.

VSE BESEDE, ENA BESEDA
Ker iskanje po eni sami besedi običajno najde velikansko število strani, ta izbor ponavadi želimo zožiti. To storimo tako, da vnesemo več besed. Pri iskanju astronomskih strani se bomo verjetno morali hitro odločiti, katero področje astronomije nas zanima. Če nas zanimajo planeti, bomo seznam najdenih strani občutno zožili, če k besedi »astronomy« dodamo še besedo »planets«. V iskalno vrstico iskalnika torej vpišemo
<I>astronomy planets<I>
Na tem mestu velja opozoriti, da si različni iskalniki vnos več besed razlagajo na različne načine. Nekateri bodo to razumeli, kot da želimo poiskati strani, na katerih nastopajo VSE vnesene besede, drugi pa bodo domnevali, da nas zanimajo strani, ki vsebujejo VSAJ ENO vneseno besedo. AltaVista predpostavlja, da želimo strani, ki vsebujejo vsaj eno podano besedo, zato z novo besedo števila najdenih strani nismo zmanjšali, ampak še povečali. Tu nam na pomoč priskoči t. i. tehnika vključevanja in izključevanja posameznih besed.
Vključevanje in izključevanje posameznih besed
Če za določeno besedo želimo, da naj se zagotovo pojavi v dokumentu, to iskalniku povemo z znakom »+«, ki ga postavimo pred besedo. V našem primeru, ko želimo strani, ki vsebujejo tako besedo »astronomy« kot besedo »planets«, to naredimo z iskalnim nizom:
<I>+astronomy +planets<I>

AltaVista nam vrne le strani, ki vsebujejo hkrati obe besedi. Lahko nas zmoti, da se med najdenimi stranmi pojavijo strani o astrologiji, ki nas ne zanimajo. V tem primeru uporabimo ukaz za izključevanje besede: pred besedo, ki je ne maramo, postavimo znak »-«. Če se torej želimo znebiti nadležnih astroloških strani, bo naš iskalni niz videti takšen:
<I>+astronomy +planets -astrology<I>
Iskanje fraz
Včasih iskanje po posameznih besedah ni dovolj. Recimo, da želimo na spletu poiskati nagovor iz Shakespearove drame Julij Cezar, za katerega vemo, da se začne z besedami »Friends, Romans, countrymen, lend me your ears«. Če v iskalnik vpišemo
<I>friends romans countrymen lend me your ears<I>,
nam iskalnik vrne kopico strani z raznoliko vsebino: od domače strani nadaljevanke Friends (Prijatelji) do strani o rimski zgodovini in vmes še cel kup drugega. V tem primeru si pomagamo tako, da frazo, ki jo želimo najti, postavimo v narekovaje in iskalniku podamo naslednji iskalni niz:
<I>«friends romans countrymen lend me your ears«<I>.
S tem smo iskalniku povedali, da hočemo res le tiste strani, ki vsebujejo podane besede v točno takem zaporedju. Sedaj nam iskalnik postreže z nekaj stranmi, med katerimi hitro najdemo tiste, ki vsebujejo iskani odlomek. V iskalni niz nismo vnesli ločil, saj jih večina iskalnikov ignorira, kmalu pa bo jasno tudi, zakaj smo uporabili same male črke.

Iskanje strani z določenim imenom
Večina dobro pripravljenih strani ima ime. To je besedilo, ki se nam med ogledovanjem strani izpiše v glavi brskalnika, če stran shranimo med zaznamke (angl. bookmarks — priljubljene povezave), pa naslov strani postane ime zaznamka. Če smo, denimo, ugotovili, da nam je všeč iskalnik AltaVista, in smo ga zato vstavili med zaznamke, je ime novega zaznamka <I>AltaVista — Welcome<I>.
Recimo, da smo nekoč obiskali spletno stran in si zapomnili, da se imenuje <I>Astronomy Picture of the Day<I>, pozabili pa smo njen naslov. Ko jo želimo spet najti, si lahko pomagamo z ukazom, ki iskalniku pove, da želimo poiskati stran z določenim imenom. AltaVista v ta namen uporablja ukaz »title« (naslov). V našem primeru želeno stran poiščemo z iskalnim nizom
<I>title:«astronomy picture of the day«
 in iskalnik nam vrne strani, katerih ime je podani niz. Spet smo uporabili samo male črke. Sedaj je čas, da pojasnimo, zakaj.

Velike in male črke
Če iskane besede vpišemo z malimi črkami, nam iskalniki poiščejo strani z iskano besedo ne glede na velikost črk. Iskanje besede »avto« bo torej našlo strani, ki vsebujejo zapis »avto«, »Avto«, »AVTO«, »aVtO« in še vse morebitne druge kombinacije velikih in malih črk. Če pa smo popolnoma prepričani, katere črke so velike in katere male, in želimo, naj iskalnik to upošteva, potem v iskalni besedi uporabimo vsaj eno veliko črko. Takrat bo iskalnik upošteval velikost črk. Iskalna beseda »Mars« nam bo torej poiskala samo strani, ki vsebujejo besedo »Mars«, ne pa tudi tistih, ki vsebujejo »MARS«, »mArs« ter še druge kombinacije velikih in malih črk.
Splošni napotek je, da pri iskanju vedno uporabljamo male črke, razen ko smo popolnoma prepričani, da vemo, kako je iskana beseda ali fraza zapisana.

Uporaba nadomestnih znakov
Včasih ne vemo, kako se beseda konča, ali pa nismo povsem prepričani, da smo jo pravilno črkovali. Morda namenoma želimo iskati besede, ki so napisane podobno (npr. besede, pri katerih se razlikuje angleška in ameriška pisava — colour : color). Takrat v iskalnem nizu uporabimo zvezdico (znak *), ki lahko nadomesti poljuben niz znakov. Spet velja, da uporabo zvezdice nekateri iskalniki podpirajo, drugi pa ne.
Iskanje v posamezni domeni
Delu naslova strežnika desno od zadnje pike rečemo »domena« ali »vrhnja domena«. V naslovu
<I>http://www.javornik-drustvo.si/«
je domena »si«. Domena pove, kateri državi spada stran (si = Slovenija, sl = Siera Leone, to = Tonga, it = Italija itd.) ali pa, kateremu delu spleta pripada (com = komercialni naslovi, edu = izobraževalne ustanove, mil = vojaške strani itd.). Nekateri iskalniki znajo svoje iskanje omejiti na poljubno domeno, kar ilustrira naslednji primer. Recimo, da smo se odločili poiskati slovenske astronomske strani. Najprej v iskalnik vnesemo iskalni niz
<I>astronomija<I>,
ki nam postreže s seznamom spletnih strani, ki vsebujejo to besedo. Med slovenskimi stranmi pa se na žalost pojavijo tudi strani drugih slovanskih narodov, ki tudi poznajo besedo »astronomija«. Izognemo se jim tako, da  iskalniku povemo, naj poišče le tiste strani, ki se nahajajo v domeni »si«. Ustrezni ukaz iskalnika AltaVista je v tem primeru »domain«, iskalni niz pa
<I>astronomija domain:si<I>.
Nekateri iskalniki podpirajo tudi iskanje strani na posameznih spletnih strežnikih.
Kako znani smo na internetu?
Postavili smo svojo spletno stran, na njej imamo številne navezave na druge strani in zanima nas, koliko drugih spletnih strani kaže na našo. Tudi pri odgovoru na to vprašanje nam na pomoč priskočijo iskalniki. AltaVista pozna ukaz »link«, s katerim povemo, da nas zanimajo le strani, ki kažejo na določeno spletno stran. Ukazu »link« moramo seveda podati ustrezen URL, kot v naslednjem iskalnem nizu
<I>link:www.tehniska-zalozba.si<I>,
ki nam pomaga poiskati vse strani z vzpostavljeno povezavo na spletišče Tehniške založbe Slovenije.

ISKALNIKI
Oglejmo si nekaj lastnosti desetih najbolj znanih iskalnikov. Doslej opisane možnosti iskanja ponujajo skoraj vsi, vendar se posamezni ukazi med iskalniki razlikujejo. Tabela prikazuje URL-je iskalnikov, kako si iskalnik razlaga vnos več besed, kako vključimo ali izključimo posamezno besedo ali frazo, kako besede združimo v frazo, ali iskalnik podpira uporabo zvezdice kot nadomestnega znaka, kako iskalniku ukažemo iskanje po imenu strani, v posamezni domeni ali na posameznem strežniku, ter kako iskalniku povemo, da bi radi poiskali strani, ki kažejo na določen URL.
        
Primerjava možnosti, ki jih ponujajo iskalniki:

Iskalnik    URL    več besed    vključi/izključi    fraza    zvezdica    ime strani    domena    strežnik    povezava na
AltaVista     poišči vsaj eno    + –    » «    DA    title:    domain:    host:    link:
Excite     poišči vsaj eno    + –    » «    NE    /    preko menija    /    /
Go     poišči vsaj eno    + –    » «    NE    title:    site:     site:    link:
Google     poišči vse    + –    » «    NE    /    preko menija    prek menija    link:
LookSmart     poišči vsaj eno    + –    » «    NE    /    /    /    /
Lycos     poišči vse    + –    » «    NE    prek menija    prek menija    prek menija    prek menija
Northern Light     poišči vse    + –    » «    DA    title:    /    /    /
WebCrawler     poišči vsaj eno    + –    » «    NE    /    /    /    /
WebTop     poišči vsaj eno    + –    » «    NE    /    prek menija    prek menija    /
Yahoo     poišči vsaj eno    + –    » «    DA    t:    /    /    /

Kateri iskalnik uporabljati? Eno izmed meril za kakovost iskalnika je število strani, ki jih ta pozna. Število pokritih strani za nekatere iskalnike je razvidno iz objavljene preglednice. Ta čas naj bi največji delež spleta pokrival iskalnik Google, katerega lastniki pravijo, da ima pregledanih čez milijardo strani. Kateri iskalnik bomo uporabljali, je odvisno tudi od številnih drugih, objektivnih in subjektivnih dejavnikov: iskalnikove hitrosti, drugih možnosti, ki jih iskalnik ponuja, prijaznosti uporabniškega vmesnika in podobnega. Ker noben iskalnik ne pokriva celotnega spleta, velja načelo »več iskalnikov več najde«. Če torej nismo zadovoljni z delom enega iskalnika, je najbolje želeno stran poskusiti poiskati še s kakim drugim.

Ševilo spletnih strani, ki jih »pokrivajo«posamezni spletni iskalniki:

Iskalnik    Število pokritih strani
Google    1,060.000.000
WebTop    500.000.000
AltaVista    350.000.000
Northern Light    270.000.000
Excite    250.000.000
Go    50.000.000

ZAHTEVNEJŠE ISKALNE TEHNIKE
Ogledali smo si glavne značilnosti posameznih iskalnikov in osnovne prijeme pri iskanju. Iskalniki omogočajo še veliko več: iskanje podobnih besed, iskanje glede na datum strani, iskanje z logičnimi izrazi, iskanje slik, zvočnih datotek itd. Vsak izmed iskalnikov ima podrobno razloženo, kaj še omogoča. Vzemite si čas takrat, ko se vam ne mudi najti kake strani, in preberite, kaj vse vam vaš priljubljeni iskalnik omogoča. Poznavanje njegovih dodatnih zmožnosti vam bo verjetno že pri naslednjem iskanju povrnilo vloženi čas in trud.

Leave a Reply

Your email address will not be published. Required fields are marked *