Căutarea informațiilor în web

Enumerăm și definim instrumente și metode de căutare în web

Definim serviciul de căutare automată

Enumerăm și explicăm componentele unui motor de căutare

Folosim motorul de căutare Google


Reactualizarea elementelor studiate


  • Ce este Internetul ?
  • Care sunt cele mai cunoscute servicii Internet ?
  • Ce este serviciul World Wide Web ?
  • Ce semnifică noțiunile : site-web, server-web, web ?
  • Ce este un browser de Internet ?

Instrumente și metode de căutare în web


- instrumente de căutare a informațiilor în web :

  • cataloage de date
  • motoare de căutare
  • meta-motoare de căutare
  • portaluri

- cataloage de date - sunt colecții de adrese de site-uri întocmite manual, grupate pe categorii și subcategorii care detaliază tema. Sunt primele instrumente de căutare care au apărut. Căutarea se face prin metoda căutării arborescente, adică pornim de la un domeniu general și parcurgem ramificațiile colecției în subdomenii cu teme tot mai particularizate.

- motoare de căutare - sunt programe care realizează o căutare automată a informațiilor prin metoda cuvintelor-cheie și au o bază de date proprie în care se centralizează informațiile din paginile și site-urile web

- meta-motoare de căutare - sunt programe care realizează o căutare automată a informațiilor prin metoda cuvintelor-cheie, dar nu au o bază de date proprie. Căutarea este transmisă unor motoare de căutare diferite iar rezultatele primite sunt centralizate.

Exemplu : www.metacrawler.com

- portaluri - este un site-web complex care conține legături spre multe site-uri web și care oferă mai multe servicii, de exemplu www, căutare, poștă electronică, forum de discuții, comerț on-line etc. În general portalurile aparțin unor companii mari.

Exemple : www.compuserve.com, www.aol.com, www.yahoo.com, www.rol.ro etc.


Serviciul de căutare automată


- Căutarea automată - este un serviciu Internet în care căutarea se face automat cu programe de tip motor de căutare (search engine) și metoda cuvintelor-cheie.

- metoda de căutare prin cuvinte-cheie înseamnă construirea de criterii de alegere a paginilor după cuvinte sau expresii cât mai apropiate de informația pe care o căutăm. Cuvintele-cheie le scriem în fereastra de căutare a motorului, iar acesta le caută în baza sa de date. Motorul nu înțelege sensul cuvintelor și caută numai potrivirea de litere (caractere) obținând uneori rezultate ciudate ale căutării. Din această cauză trebuie uneori să clarificăm căutarea folosind operatori sau cuvinte-cheie mai potrivite.

- Exemple : motoare de căutare găsim pe unele site-uri și portaluri:

  • www.google.ro (.com)
  • - firma Google Inc. oferă din 1997 cel mai puternic motor de căutare până în prezent, care realizează peste 80% din căutările din Internet și a fost tradus în 124 limbi.

  • www.yahoo.com
  • www.bing.com
  • www.aol.com
  • www.kappa.ro

- site-urile mari oferă motoare de căutare interne pentru găsirea informațiilor în interiorul site-ului

Exemplu : motorul intern de căutare al siteului youtube.com:


- părțile unui motor de căutare :

  1. robotul (eng. spider) este un program care citește toate paginile-web existente și extrage informații din ele pe care le scrie în index. Roboții au o capacitate foarte mare de a citi, vizitând milioane de pagini/zi. Deoarece conținutul paginilor se schimbă, roboții lucrează fără oprire și reiau automat citirea paginilor după câteva săptămâni.
  2. indexul (catalogul) este o bază de date uriașă în care sunt informații despre fiecare pagină-web găsită de robot (titlu, adresa, cuvinte-cheie folosite, porțiuni de text). Informațiile sunt permanent actualizate de către robot, la fiecare vizită a acestuia.
  3. softul de căutare este un program care preia cuvintele-cheie introduse de operator și le caută în milioanele de pagini din index, apoi afișează rezultatul pe ecran sub forma unei liste de legături într-o ordine pe care o consideră el importantă.

Lectură suplimentară


1. Google Inc. :


2. Vizită în Centre de date Google :

3. Top 8 curiozități despre Google :