Căutarea informațiilor în web

Enumerăm și definim instrumente și metode de căutare în web

Enumerăm și analizăm componentele unui motor de căutare

Utilizăm motorul de căutare Google


Instrumente și metode de căutare în web


- instrumente de căutare a informațiilor în web :

  • cataloage de date
  • motoare de căutare
  • meta-motoare de căutare
  • portaluri

- cataloage de date - sunt colecții de adrese de site-uri întocmite manual, grupate pe categorii și subcategorii care detaliază un anumit subiect. Căutarea se face prin metoda căutării arborescente, adică pornim de la o temă generală și parcurgem ramificațiile în subteme tot mai particularizate. Sunt primele instrumente de căutare care au apărut.

- motoare de căutare - sunt programe care realizează o căutare automată a informațiilor prin metoda cuvintelor-cheie și au o bază de date proprie în care se centralizează informațiile din paginile și site-urile web

- meta-motoare de căutare - sunt programe care realizează o căutare automată a informațiilor prin metoda cuvintelor-cheie, dar nu au o bază de date proprie. Căutarea este transmisă unor motoare de căutare diferite iar rezultatele primite sunt centralizate.

- portaluri - este un site-web complex care conține legături spre multe site-uri web și care oferă mai multe servicii, de exemplu www, căutare, poștă electronică, forum de discuții, comerț on-line etc. În general portalurile aparțin unor companii mari.

Exemple : www.yahoo.com, www.aol.com, www.rol.ro etc.


Serviciul de căutare automată


- Căutarea automată - este un serviciu Internet în care căutarea se face automat cu programe de tip motor de căutare (search engine) și metoda cuvintelor-cheie.

- metoda de căutare prin cuvinte-cheie înseamnă construirea de criterii de alegere a paginilor după cuvinte sau expresii cât mai apropiate de informația pe care o căutăm. Cuvintele-cheie le scriem în caseta de căutare a motorului, iar acesta le caută în baza sa de date (catalog). Motorul nu înțelege sensul cuvintelor și caută potrivirea de litere (caractere) obținând uneori rezultate ciudate ale căutării. Din această cauză trebuie uneori să clarificăm căutarea folosind operatori sau cuvinte-cheie mai potrivite.

- Exemple : motoare de căutare găsim pe unele site-uri și portaluri:

  • www.google.com
  • - firma Google Inc. oferă din 1997 cel mai puternic motor și mai folosit de căutare până în prezent, tradus în peste o sută de limbi.

  • www.bing.com
  • www.yahoo.com
  • www.aol.com

- unele site-uri oferă motoare de căutare interne pentru găsirea informațiilor în interiorul site-ului

Exemplu : motorul intern de căutare al siteului youtube.com:


- părțile unui motor de căutare :

  1. robotul (eng. spider) este un program care citește toate paginile-web existente în web și extrage informații din ele pe care le scriu în index.
    "Viteza" de lucru a roboților este enormă, vizitează milioane de pagini/zi.
    Roboții lucrează fără oprire și reiau automat citirea paginilor după câteva săptămâni deoarece conținutul paginilor deseori se schimbă.

  2. indexul (catalogul) este o bază de date uriașă în care sunt informații extrase din fiecare pagină-web găsită de robot (titlu, adresa, cuvinte-cheie folosite, porțiuni de text).
    Informațiile sunt actualizate la fiecare vizită a robotului în pagină.

  3. softul de căutare este programul care :
    • afișează caseta de căutare în care noi scriem cuvintul-cheie
    • caută cuvântul-cheie în milioanele de pagini din index
    • afișează rezultatul pe ecran sub forma unei liste de legături într-o ordine pe care o consideră el importantă

Lectură suplimentară


Google Inc. :