Documents

Cautare_internet.pdf

Categories
Published
of 13
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Related Documents
Share
Description
Modalităţi de căutare a informaţiei de tip text, imagine şi sunet în documentele electronice hypermedia Dorel MICLE Universitatea de Vest Timişoara Căutarea în Internet poate fi o operaţie de durată, enervantă pentru un începător, volumul de informaţii este enorm şi modurile de stocare şi de regăsire a lor sunt foarte diferite. Procesul de căutare este întotdeauna dificil, din cauza numărului mare de instru
Transcript
   1 Modalit ăţ i de c ă utare a informa ţ iei de tip text, imagine ş i sunet în documentele electronice hypermedia   Dorel MICLE Universitatea de Vest Timi ş oara C ă utarea în Internet poate fi o opera ţ ie de durat ă , enervant ă  pentru un  încep ă tor, volumul de informa ţ ii este enorm ş i modurile de stocare ş i de reg ă sire a lor sunt foarte diferite. Procesul de c ă utare este întotdeauna dificil, din cauza num ă rului mare de instrumente de c ă utare, a con ţ inutului lor diferit de informa ţ ii ş i de metode de c ă utare, precum ş i din cauza lipsei unor standarde. Cele mai c ă utate documente electronice hypermedia  sunt cele care con ţ in informa ţ ii de tip text ş i imagine. Exist ă , desigur, ş i alte tipuri de documente ce con ţ in filme, sunete, grafic ă  3D, etc. dar pentru domeniul ş tiin ţ elor umaniste, textul ş i imaginea r  ă mân componentele de baz ă  ale unui document electronic. Fie c ă  sunt destinate unei valorific ă ri didactice, fie unei valorific ă ri ş tiin ţ ifice, asocierea dintre cuvântul scris ş i imagine este cea mai r  ă spândit ă   ş i mai des utilizat ă  în acest domeniu de activitate. Prezentarea de mai jos este destinat ă  cu prec ă dere speciali ş tilor în ş tiin ţ ele umane, studen ţ ilor ş i cadrelor didactice care, în procesul complex de informare ş i documentare, utilizeaz ă  documente electronice. a. C  ă utarea informa ţ  iei de tip text Motoarele de c  ă utare  sunt baze de date ce indexeaz ă  paginile Web  sau titlurile de pagini. Ele trimit prin Web  „  p ă ianjeni electronici  ” („ robo ţ  i web ”) pentru a c ă uta pagini ce ar putea fi ad ă ugate la baza de date de pagini Web  deja existente. Atunci când „robotul” identific ă  un site  care înc ă  nu a fost indexat, el îl adaug ă  la baza sa de date care, cel mai frecvent, con ţ ine titlul paginii, adresa pentru Internet ( URL ), pagini complementare ş i o por  ţ iune a textului respectiv. De ş i „robo ţ ii” lucreaz ă  constant, mai sunt înc ă  milioane de pagini în Web  care trebuie s ă  fie rev ă zute, iat ă  de ce va lua mult timp c ă utarea unui site  nou. Ca rezultat, persoanele care î  ş i creeaz ă  propriile lor Website -uri, încep prin a oferii informa ţ ii despre propriile lor pagini motoarelor de c ă utare, care în felul acesta identific ă   ş i înregistreaz ă  în mod sigur noua adres ă . Exist ă  un num ă r de motoare de c ă utare pe care le pute ţ i utiliza în Internet. Drept exemple de motoare de c ă utare pot servi: Excite , Alta Vista , Hotbot , Infoseek , Lycos , WebCrawler  , Google   ş i Open Text Index . De obicei, se introduc cuvintele-cheie în motoarele de c ă utare ş i ele se ocup ă  de c ă utarea paginilor din Web  care se potrivesc cuvântului. Instrumentele de c  ă utare  sunt programe destinate ob ţ inerii de informa ţ ii. Metodele de c ă utare pot fi diferite: arborescent  ă  sau de tip director   ( directory   - vezi LookSmart ), mecanism de c  ă utare  ( search engine  - vezi   2 Alta Vista ), o combinatie între tipurile arborescent ş i mecanism de c  ă utare  ( directory/search engine  - vezi Excite ,  Yahoo ) ş i multi-mecanism  ( multi- engine  - vezi All-In-One , Metacrawler  ). a) Un sistem de c ă utare arborescent  ă  folose ş te subiectul   ( domeniul  ) c ă ut ă rii. Metoda de c ă utare este una de tip ierarhic, care începe cu domeniul general, apoi urmeaz ă  o succesiune de alte subdomenii. Se mai nume ş te ş i c  ă utare dup ă  subiect   ( subject search ). Directoarele siturilor clasific ă  arborescent, în categorii, siturile din Web . Fiecare categorie, ca de exemplu Istorie , poate fi divizata în subcategorii precum Istorie regional  ă  (Istoria Europei – Albania, Austria, Belgia, Bulgaria, etc. -, Istoria Americii de Nord, Istoria Asiei, etc.), Epoci istorice  (Epoca pietrei, Epoca bronzului, Epoca fierului, Epoca roman ă , etc.), Domenii istorice  (Arheologie ş i Antropologie, Studii clasice, Medievistic ă , Diploma ţ ie, Heraldic ă , Arhivistic ă , etc.) Institu  ţ  ii de istorie  (Muzee, Universit ăţ i, Societ ăţ i de istorie, Institute de istorie, Laboratoare de istorie, etc.), etc. Pentru a v ă  mi ş ca în interiorul acestor directoare, trebuie s ă  ap ă sa ţ i pe leg ă turile dintre fiecare categorie ş i subcategorie pân ă  când ve ţ i g ă si ceea ce c ă uta ţ i. Sau, pute ţ i utiliza c ă utarea cu ajutorul cuvântului-cheie pentru a g ă si anumite site -uri specifice. În majoritatea cazurilor, cei care î  ş i creeaz ă  propriile site -uri de Web   ş i le  înregistreaz ă  cu un director de site . Drept exemple de directoare de site -uri pot servi: Looksmart ,  Yahoo , The World Wide Web Virtual Library   ş i The Argus Clearinhouse . b) Un mecanism de c ă utare este un instrument ce acceseaz ă  bazele de date folosind cuvinte cheie . El r  ă spunde la diferite cereri cu o list ă  de referin ţ e; se mai nume ş te ş i c  ă utare pe baz  ă  de cuvânt cheie  ( keyword search ). Este cel mai utilizat ş i cel mai complex mecanism de c ă utare, astfel  încât el va face subiectul unei descrieri am ă nun ţ ite pu ţ in mai jos. Exemple: Alta Vista , Google , etc. c) A treia metod ă  de c ă utare este o metod  ă  combinat  ă : directory/search engine . Astfel de instrumente de c ă utare folosesc ambele metode descrise mai sus, ş i se bazeaz ă  pe un sistem de c ă utare ierarhic, la fiecare pas putându-se accesa un mecanism de c ă utare, efectuându-se apoi, dac ă  se dore ş te, o c ă utare dup ă  cuvinte-cheie. Aceste utilitare de c ă utare adaug ă  selectiv materiale la baza de date ş i revizuiesc site -urile bazate pe con ţ inut. Ele pot exclude site -urile ce con ţ in materiale inacceptabile, sau pot accepta doar acele site -uri, pe care le consider  ă  potrivite. Se folosesc de o varietate de criterii pentru a judeca site -urile posibile, incluzând calitatea materialului    ş i cantitatea materialului.  Exemplu de utilitar de c ă utare specific: Magellan . d) A patra metod ă   multi-mecanism  ( multi-engine  - vezi All-In-One , Metacrawler, Mamma, etc. ) face referire la acele motoare de c ă utare care analizeaz ă  con ţ inutul tuturor celorlalte categorii de motoare. Nu totdeauna aceste motoare de c ă utare sunt ş i cele mai practice din cauza num ă rului foarte mare de rezultate afi ş ate.   3 C ă utarea dup ă  cuvânt-cheie Dac ă  în urma unei c ă ut ă ri, dup ă  cuvânt-cheie, rezultatele cercet ă rii pentru cuvântul respectiv sunt pe ultima pagina a motorului de c ă utare utilizat, atunci se reformuleaz ă  interoga ţ ia sau se schimb ă  motorul de c ă utare. Motoarele de c ă utare func ţ ioneaz ă  autonom ş i pute ţ i avea surpriza s ă  identifica ţ i adrese diferite utilizând aceea ş i interoga ţ ie pe motoare de c ă utare diferite, sau s ă  identifica ţ i acelea ş i adrese utilizând îns ă  interoga ţ ii diferite pe acela ş i motor de c ă utare. Câteva reguli generale desf  ăş urate mai jos v ă  pot ajuta la c ă utarea informa ţ iei dumneavoastr  ă  în Internet. 1. Formula ţ i interoga ţ ii cât mai scurte ş i utiliza ţ i cuvinte-cheie . Este necesar s ă  re ţ ine ţ i faptul c ă  un calculator, nu o persoan ă , va analiza ceea ce a- ţ i supus examin ă rii/cercet ă rii. Supunând cercet ă rii interoga ţ ii lungi precum «  A ş  vrea sa ş tiu cine a fost Homer  » va z ă p ă ci munca motorului de c ă utare ş i va duce la rezultate nepl ă cute. O formulare mult mai adecvat ă  poate fi simpla introducere a numelui lui Homer    ş i eventual a domeniului istorie antic  ă , pentru c ă  altfel risca ţ i s ă  primi ţ i informa ţ ii despre detergentul Homer   sau sta ţ  iunea balneoclimateric  ă  Homer  . 2. Utiliza ţ i operatori logici pentru a va formula interoga ţ ia . Operatorii sunt reguli sau instruc ţ iuni speciale folosite într-o c ă utare pe baz ă  de cuvinte cheie, pentru a formula întreb ă ri sau cereri. C ă utarea pe baz ă  de cuvinte cheie se începe prin scrierea unui cuvânt în caseta search box a paginii home a motorului de c ă utare. Pentru a construi o cerere, se pot folosi operatorii adecva ţ i din motorul de c ă utare în care se desf  ăş oar  ă  sesiunea de lucru. În timp ce fiecare motor de c ă utare are operatori proprii, exist ă  câ ţ iva comuni pentru toate utilitarele de c ă utare: a) Operatorii AND, OR, NEAR si NOT pot fi folosi ţ i pentru a conecta cuvinte ş i termeni în cadrul unei cereri, cu sensurile lor logice: AND înseamn ă  c ă  ambele cuvinte sunt prezente în cadrul documentelor. NEAR înseamn ă  c ă  un termen trebuie s ă  fie g ă sit în cadrul unui num ă r specificat de cuvinte. OR  înseamn ă  c ă  cel pu ţ in un termen este prezent, iar NOT exclude prezen ţ a unui termen. b) Când folosi ţ i ace ş ti operatori, nu uita ţ i s ă -i scrie ţ i cu litere mari, f  ă r  ă  s ă  l ă sa ţ i un spa ţ iu între operator ş i termenii care îi urmeaz ă . c) Semnele „+” ş i „-”; „+” înaintea unui termen (f  ă r  ă  spa ţ ii) ajut ă  la reg ă sirea doar a documentelor con ţ inând acel termen ş i este similar cu AND; „-” este similar lui NOT, reg ă sind documentele care nu con ţ in respectivul termen. d) Apostrofurile (‘’) sau ghilimelele („”) marcheaz ă  cuvinte care trebuie tratate exact cum sunt. Aceste semne sunt similare cu operatorul NEAR. e) Parantezele sunt utilizate ca ş i semnele de la c), dar cuvântul dintre paranteze este considerat o singur  ă  entitate. f) Cuvintele scrise cu majuscule sunt tratate ca un nume propriu. Virgulele separ  ă  numele proprii. g) Un asterisc îndepline ş te func ţ ia de l ă rgire a r  ă d ă cinilor. Plasa ţ i un asterisc ”*” la sfâr  ş itul cuvântului pentru a g ă si toate cuvintele   4 ce încep cu literele tip ă rite. Spre exemplu, c ă utând “istorie”, el creeaz ă  leg ă turi cu paginile Web  cu cuvintele “istorie”, ”istorici”, ”istoriografie”. h) Utiliza ţ i operatorul logic ADJ (adiacent) dac ă  dori ţ i s ă  g ă si ţ i documente în care termenii apar unul lâng ă  altul, în orice ordine. i) Operatorul FAR (departe) este opus operatorului NEAR. Când utiliza ţ i FAR, vor fi g ă site documentele în care termenii se afl ă  la o distan ţă  mai mare de 25 de cuvinte unul de altul. (expl.: Lycos ). FAR se utilizeaz ă  foarte des împreun ă  cu alte expresii. De exemplu, pute ţ i s ă  c ă uta ţ i istorie  FAR antic   NOT istorie antic  ă ş i ve ţ i g ă si pagini ce con ţ in ambele cuvinte dar nu istorie antic  ă .  j) Operatorul BEFORE (înainte) func ţ ioneaz ă  foarte asem ă n ă tor cu AND. Unica deosebire este c ă  termenii trebuie s ă  apar  ă  în ordinea pe care o specifica ţ i, dar pot s ă  se afle la orice distan ţă   în acela ş i document.  În tabelul de mai jos sunt prezentate categoriile de operatori raporta ţ i la principalele motoare de c ă utare: Alta Vista (ii) Excite (i) Hotbot (iii) Infoseek Lycos Magellan (iv) Webcrawler Yahoo + x x x x x x x x - x x x x x x x x And ( ş i) x x x x x x x and not x x x Not (nu) x x x Or (sau) x x x x x x x Adj (adiacent) x Before (înainte) x Far (departe) x Near (aproape) x x ( ) x x x x x * x x x x x x x x x Language x x x
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks