Wikisage is op 1 na de grootste internet-encyclopedie in het Nederlands. Iedereen kan de hier verzamelde kennis gratis gebruiken, zonder storende advertenties. De Koninklijke Bibliotheek van Nederland heeft Wikisage in 2018 aangemerkt als digitaal erfgoed.
- Wilt u meehelpen om Wikisage te laten groeien? Maak dan een account aan. U bent van harte welkom. Zie: Portaal:Gebruikers.
- Bent u blij met Wikisage, of wilt u juist meer? Dan stellen we een bescheiden donatie om de kosten te bestrijden zeer op prijs. Zie: Portaal:Donaties.
Zoekmachine
Een zoekmachine (Engels: "search engine") is een instrument waarmee men informatie kan zoeken in een bepaalde collectie; dit kan een bibliotheek, het internet, of een persoonlijke verzameling zijn. Zonder nadere aanduiding bedoelt men tegenwoordig meestal een webdienst waarmee met behulp van vrije trefwoorden volledige tekst (full text) kan worden gezocht in het gehele World Wide Web.
In tegenstelling tot startpagina's of webgidsen is er geen of zeer weinig menselijke tussenkomst nodig; het bezoeken van de webpagina's en het sorteren van de rangschikkingen gebeurt met behulp van een algoritme.
Google is in de Benelux de meest gebruikte zoekmachine, in andere landen zijn ook Yahoo!, MSN Search, Baidu, ... populaire zoekmachines.
Technieken
Zoekmachines indexeren webpagina's geautomatiseerd door middel van robots/spiders. Dit zijn programma's die webpagina's downloaden en vervolgens nuttige informatie verzamelen van de pagina, zoals woorden en verwijzingen. De links worden weer aan de spider als input gegeven om weer gedownload te worden. De gevonden woorden worden opgeslagen in een gigantische database.
De zoekmachines werken met verschillende technieken. Oorspronkelijk werkten de zoekmachines met de door de webmasters zelf opgegeven zoektermen (keywords), maar daar werd veel misbruik van gemaakt doordat de webmasters keywords gingen gebruiken die veel publiek trokken, maar geen verband hielden met de inhoud van de pagina, zoals het woord 'seks'.
Daarom werden diverse andere alternatieve technieken ontwikkeld. Zo werkt onder andere Google met de populariteit van de websites: het aantal malen dat een website op andere websites wordt vermeld. Op de websites van de zoekmachines is meestal wel informatie te vinden over hoe ze werken.
Het aantal spider-based-zoekmachines is beperkt. Grote internationale zoekmachines zijn Google, Teoma, Windows Live Search en Yahoo. Bekende Nederlandse zoekmachines bedoeld om te zoeken naar Nederlandstalige pagina's zijn Kobala, Ilse en voorheen ook Track. Walhello is een in Nederland ontwikkelde internationale zoekmachine.
Er zijn ook metazoekmachines, zoekmachines die werken via de resultaten van andere zoekmachines. Voorbeelden zijn Metacrawler, Ixquick en Ez2Find. Nederland kent ook metazoekmachines zoals Zoeken.nl, Multizoeker, Metaspider.nl, Zoekal en Laquza.
Wolfram Alpha is een zoekmachine op internet, die niet zoekt naar pagina's (zoals Google doet), maar naar antwoorden op vragen, dat doet hij door te zoeken in een database van informatie
Gebieden
De meeste zoekmachines zijn bedoeld om iets op het web te vinden via het HTTP-protocol. Het gaat dan om informatie die ook met een browser bekeken kan worden. Daarnaast kunnen sommige zoekmachines ook informatie in nieuwsgroepen vinden. Bijvoorbeeld Google kopieert veel nieuwsgroepen naar de eigen servers, zodat daar in gezocht kan worden. Tot slot zijn er enkele zoekmachines die kunnen zoeken naar bestanden via het File Transfer Protocol.
Zoekmachine Marketing
Zie ook: Zoekmachine-optimalisatie Zoekmachine Marketing(search engine marketing) is het geheel aan activiteiten bedoeld om een webpagina hoog te laten scoren in de zoekresultaten van een zoekmachine, op voor de webpagina relevante trefwoorden of zoektermen. Zoekmachine Marketing bestaat uit twee onderdelen:
Adverteren bij zoekmachines
Een andere manier om 'hoog te scoren' bij zoekmachines is adverteren. Aanvankelijk kon er tegen betaling een plaats hoog in de ranking 'gekocht' worden als advertentie. Tegenwoordig is het bij bijna alle zoekmachines zo dat een dergelijke praktijk niet meer mogelijk is, omdat gebruikers het niet meer accepteren. In plaats daarvan worden er op een aparte plaats (vaak aan de rechterkant, soms ook bovenaan) zogenaamde 'gesponsorde koppelingen' getoond. Dit wordt door gebruikers als minder storend ervaren, omdat 'echte resultaten' en advertenties duidelijker te onderscheiden zijn.
De advertentieruimte bij de gesponsorde koppelingen wordt meestal 'verkocht' per opbod via het 'pay per click' systeem. Bij bijvoorbeeld Google Adwords wordt de positie bij de gesponsorde koppelingen bepaald door de bieding van de adverteerder te vermenigvuldigen met de Click-Through Rate.
Gespecialiseerde zoekmachines
Om de hegemonie van marktleiders als Google te ontlopen richten sommige zoekmachines zich op een bepaald specialisatiegebied. Zij worden ook wel verticale zoekmachines genoemd. Omdat zij speciaal zijn ontworpen om juist voor dit speciale gebied de beste resultaten naar boven te halen, denken zij het hier beter te doen dan algemene zoekmachines.
Een van die specialisatiegebieden is de academische wereld. Elsevier richt zich met Scopus op dit gat in de markt, waarmee zowel wetenschappelijk tijdschriften worden doorzocht, als wel de academische kennis op het Internet door gebruik te maken van Scirus. Web of Science (van Thompson Isi) is een concurrent die negenduizend tijdschriften en een krantenarchief van zestig jaar doorzoekt. Google probeert met Google Scholar zelf ook een speler in deze markt te worden. OAIster van de Universiteit van Michigan richt zich op wetenschappelijke informatie die door ruim duizend universiteiten en onderzoekscentra via Digital Academic Repositories beschikbaar wordt gemaakt. De MedischeZoekmachine.nl richt zich speciaal op medische zoektermen.
Een andere specialisatiegebied voor zoekmachines zijn diensten en consumentenproducten. Voor het vinden van op de Nederlandse markt huizen zijn Jaap.nl en Zuka.nl gespecialiseerd, voor vacatures Askjim.nl, en voor auto's Gaspedaal.nl. Het Nederlandse El Cheapo heeft zich gespecialiseerd in het vergelijken van bepaalde producten bij verschillende aanbieders. Google doet hetzelfde met Froogle. Onderwijsinformatie is te vinden met Davindi. Een internationale boekenzoeksite is Addall.com.
Nadelen zoekmachines
Naast de vele voordelen van zoekmachines zoals Google, kleven er ook nadelen aan het gebruik van grote zoekmachines. Door de toename van data wordt het steeds moeilijker om gerichter te kunnen zoeken op een bepaald gebied, of in een andere taal dan het Engels. Vaak kun je op kleine, regionale zoekmachines', zoals hierboven staat beschreven, wel specifieke informatie krijgen in jouw taal, maar bij dit soort zoekmachines ontbreken de zoek –en analysekwaliteiten. Voor vele grote zoekmachines is het een uitdaging om ook deze kleine, regionale sites te betrekken in hun zoekresultaten.
Doordat zoekmachines heel het internet in kaart kunnen brengen vormen ze ook een probleem inzake privacy. Als privacygevoelige data eenmaal op internet zijn gepubliceerd zijn die data , zelfs als deze verwijderd zijn van de website waar zij stonden, vaak terug te vinden in de archieven van zoekmachines.
Daarnaast zou Google niet goed omgaan met de privacy van gebruikers van de zoekmachine. Zo zou Google de data niet-geanonimiseerd opslaan om aan de hand van de zoekgeschiedenis van de gebruiker beter passende advertenties te tonen.
Zie ook
Literatuur
- Chung et al (2006) “SpidersRUs: Creating specialized search engines in multiple languages,” Decision Support Systems,, nr. 42, pp. 1697-1714
- Chau et al (2007) “Supporting non-English Web searching: An experiment on the Spanish business and the Arabic medical intelligence portals,” Decision Support Systems
- Hargittai, E. (2007) “The social, political, economic, and cultural dimensions of search engines: An introduction,” Journal of Computer-Mediated Communication, nr. 12
- Guan, T en K. F. Wong (2003) “Nstar: an interactive tool for local web search,” Information & Management, nr 41, pp. 213-225
- Braun-LaTour et al (2007) “Mood, information congruency, and overload,” Journal of Business Research, nr. 60, pp. 1109-1116
Zie ook de categorie met mediabestanden in verband met Internet search engines op Wikimedia Commons.