Nadel im Heuhaufen

Suchmaschinen im Internet

Das Internet bietet inzwischen eine so große Fülle von interessanten und uninteressanten Dinge, daß man keine Chance mehr hat einen Überblick davon zu bekommen. Damit man die Information oder das Programm das man gerade benötigt überhaupt im weltweiten Netz finden kann gibt es Suchmaschinen. Doch leider führt eine Befragung einer Suchmaschine nicht immer zu einen befriedigenden Ergebnis. Dies liegt meist an der Art und Weise, wie man ein Suchmaschine befragt. Dieser Artikel will eine kleine Einführung in die Benutzung von Suchmaschinen geben und auch gleich einige wenige vorstellen. Beginnen wir mit den Suchmaschinen für das World Wide Web.

Die älteste Suchmaschine des World Wide Webs ist Yahoo!. Yahoo! ist im Prinzip nichts anderes als eine sehr große und gut strukturierte Sammlung von Verweisen auf andere Internetseiten. Alle Links werden von dem Yahoo!-Team, also Menschen, ausgewählt. Von der Eingangseite aus wählt man eine Rubrik aus und bekommt ein Seite mit Links und weiteren Rubriken der ausgewählten Rubrik. So kann man sich an das Gesuchte Schritt für Schritt herantasten. Dies Verfahren ist einfach zu benutzen und hat den Vorteil, daß man recht schnell an sein Ziel kommt. Der Nachteil ist, das Yahoo! nur einen sehr kleinen Teil des WWW zeigt. Aber Trotz dieses Nachteils kommt man, je nachdem was man sucht, oft schneller und einfacher ans Ziel als bei den anderen Suchmaschinen. Dies liegt daran, daß die Leute bei Yahoo! die (hoffentlich) interessantesten Web-Seiten herrausgesucht haben.

Wohl alle Suchmaschinen, auch Yahoo!, bieten die Möglichkeit der Schlagwortsuche. Gibt man in das Eingabefeld der Suchmaschine ein Wort ein, z. B. "arche", werden die Datenbestände nach diesem Wort durchsucht und als Verweise zurückgegeben. Bei "arche" werden sehr viele Web-Seiten gefunden, denn es gibt ja nicht nur den bekannten Acorn Club, sondern auch dieses Schiff, eine christliche Gemeinde, eine Zeitung usw. in Internet mit diesen Namen. AltaVista fand Anfang März 1999 43.149 Seiten zum Schlagwort "arche" und irgendwo in dieser Menge ist auch der Arche ACORN User Club. Man muß also seine Anfrage etwas präziser formulieren um schneller bzw. überhaupt die gesuchte Site zu finden.

Man kann die Antwort einschränken, indem man zwei oder mehrere Schlagwörter eingibt. Diese Stichwörter werden mit der Boolischen Algebra verknüpft. Die ODER- oder auch OR-Verknüpfung kommt zu einen positiven Ergebnis, wenn mindestens ein Schlagwort in der jeweilgen Web-Seite gefunden wurde. Es werden so mehr Seiten gefunden. Die meisten Suchmaschinen sortieren das Ergebnis, so daß die Seiten in denen die meisten der eingegebenen Schlagwörter stehen auch zuerst angezeigt werden. Man spricht dann auch von einer ANDOR-Verknüpfung. Die meisten Suchmaschinen habe diese ANDOR-Verknüpfung voreingestellt. Man braucht nur die einzelnen Schlagwörter hintereinander mit einen Leerzeichnen getrennt in das Eingabefeld einzugeben (z. B. "arche acorn"). Dank der ANDOR-Verknüpfung fand AltaVista 45.850 Seiten, aber mit allen 10 Links der ersten Seite kann schnell zu den Arche-Seiten.

Bei der UND- bzw. AND-Verknüpfung müssen alle Schlagwörter in der jeweiligen Seite vorhanden sein. Bis auf HobBot werden bei allen hier vorgestellten Web-Suchmaschinen (siehe Kasten) die AND-Verknüpfung mit dem Pluszeichen markiert: "+arche +acorn". Bei HobBot muß über ein Popup-Menü "all the words" eingestellt werden. AltaVista fand nur 142 Seiten und wieder führten alle 10 Links der ersten Seite zur Arche, auch wenn sich diese Seite von der ANDOR-Seite unterschied.

Die meisten Suchmaschinen erlauben den Ausschluß eines Schlagwortes (NOT-Verknüpfung) mit eine vorrangestellten Minuszeichen. Mit der Eingabe "computer -microsoft" wird nach Seiten gesucht, in denen das Wort "computer" aber nicht "microsoft" vorkommen darf. Zusätzlich beherrschen viele Suchmaschinen auch die Möglichkeit der NEBENEINANDER-Verknüpfung. Dies braucht man wenn man nach einer Phrase, wie z. B. "German Archimedes Group" sucht. Solch eine Phrase umschließt man mit den Anführungszeichen (""german archimedes group""). Alle Verknüpfungsarten kann man natürlich auch miteinander kombinieren.

Ich habe die Schlagwörter kleingeschrieben, da die meisten Suchmaschinen die Groß- und Kleinschreibung ignorieren. Bei einigen Suchmaschinen (AltaVista, HobBot und Infoseek) wird nach genau der Schreibweise des Schlagwortes gesucht, falls mindestens ein großgeschriebene Buchstabe vorkommt. Bei HobBot muß mindestens der erste Buchstabe großgeschrieben sein. Mit diesen Suchmaschinen werden z. B. mit "NeXt" deutlich weniger Seiten gefunden als mit "next".

Dies sollte erstmal als Einstieg in der Benutzung von Web-Suchmaschinen reichen. Die einzelnen Suchmaschinen haben noch spezifische Features wie z. B. Auswahl der Sprache (AltaVista) oder des Kontinent bzw. einen Teil davon (HobBot). Auch wird oft eine Advantage bzw. Power Search angeboten. Dies kann ein sehr mächtiges Werkzeug sein, aber z. B. bei AltaVista ist es auch nicht leicht dies richtig zu bedienen. Wenn man diese Suchen beherrschen möchte, muß man auf alle Fälle die Hilfetexte der jeweiligen Suchmaschine gut studieren.

Sollte eine Anfrage nicht direkt Erfolgreich sein, sollte man nicht direkt die Flinte ins Korn werfen, sondern die Eingabe anderes formulieren und/oder eine andere Suchmaschine befragen. Welche die richtige Suchmaschine ist, kann man nicht so einfach beantworten. Jede hat ihre Stärken und Schwächen. Einmal kann Yahoo! ein anderemal kann HobBot die bessere Wahl sein. Mit ein bißchen Erfahrung bekommt man mit der Zeit ein Gefühl für die Auswahl. Selbstverständlich kann man ruhig mehrere Suchmaschine gleichzeitig befragen.

Auch wenn das World Wide Web das Synonym für das Internet geworden ist, gibt es noch einige andere Dienste wie z. B. FTP, News und Mail (die wichtigste Internetanwendung von allen!). Auch für die genannten Dienste gibt es Suchmaschinen.

Meist sind PD-, Freeware und Shareware-Programme auf FTP-Server zu finden. Diese Programme können natürlich nicht von Web-Suchmaschinen gefunden werden. Damit man sich nicht selbst durch die FTP-Server wühlen muß, gibt es den alten Internet-Dienst Archie. Einer von vielen Archies in der Welt ist bei der TH Darmstadt. Der Archie ist recht einfach zu bedienen, man braucht nur den Namen bzw. einen Teil des Namens einzugeben. Der eingebende Programmname sollte aber weder Ausrufezeichen noch Dateiendung (z. B. ".zip") enthalten. Man kann bei der Darmstädter Suchmaschine noch einige Einstellungen vornehmen und sogar mit Reguläre Ausdrücke (siehe auch "Wer sucht der findet auch") suchen.

In Norwegen gibt es mit FTP search eine andere Suchmaschine die FTP-Server durchsucht. Wie gehabt muß man auch hier ein Schlagwort, also ein Programmnamen, Bildnamen usw. eingeben. Wie beim Archie kann man auch hier mit allen möglichen Einstellungen, wie z. B. Reguläre Ausdrücke die Suche einschränken. Aber zusätzlich gibt es ein wichtiges Tool, das Eingabefeld "Limit to path". Mit diesen Eingabefeld kann man FTP search mitteilen in welchen Verzeichnissen gesucht werden soll. Wenn man in dieses Feld z. B. "acorn" eingibt, werden nur die Verzeichniszweige durchsucht, in denen "acorn" vorkommt. Natürlich ist ein Verzeichnisname zuwenig, da die unterschiedlichen FTP-Server die Dateien für unsere Rechner in Verzeichnissen mit unterschiedlichen Namen packen. Üblich sind die Verzeichnisnamen "acorn", "riscos" und "archimedes". Wenn man nun in "Limit to path" die Verzeichnisse mit einen Doppelpunkt trennt ("acorn:riscos:archimedes"), wird nur in diesen Verzeichnisszweigen gesucht und wird nicht auch Programme für Unix, WinDOS usw. finden.

Auch Filez durchsucht FTP-Server nach Programmen, Bildern usw. Aber Filez bietet einige andere Möglichkeiten die Abfrage einzuschränken. Wie bei jeder Suchmaschine gibt es auch hier ein Eingabefeld, indem man den Namen bzw. einen Teil des gesuchte Programmes, Bildes usw. eingeben kann. Das besondere Feature ist, daß man die Rechnerplattform angeben kann. Neben WinDOS, Macintosh, Unix usw. kann sogar "Acorn" auswählen werden, um so nicht mit Programmen für andere Betriebssysteme "belästigt" zu werden. Statt Programmen für ein Betriebssystem kann man sich auch Bilder, Sounds, Filme usw. heraussuchen lassen. Dabei kann man auch das Eingabefeld leer lassen und damit nach allen Dateien des gewählten Dateityps suchen. Das Betriebssystem bzw. der Dateityp wird über ein Popup-Menü ausgewählt.

Bei ArcSite gibt es mit ArcArchie extra eine Suchmaschine die, der Name sagt es schon, FTP-Server nach Dateien für die Acorn-Rechner durchsucht. Die Benutzung ist recht einfach, man braucht nur einen Teil des Programmnamens einzugeben und gegebenenfalls den einen oder anderen FTP-Server bei der Suche ausschließen und damit die Suche beschleunigen. ArcArchie durchsucht nur die Acorn-Zweige der FTP-Server von Demon, Hensa, der Universität Stuttgart und den Freenet-Zweig.

Das Usenet ist das größte Komunikationsforum der Welt. In über 25.000 Gruppen wird über mehr Themen diskutiert, als man sich vorstellen kann. Mit Deja News gibt es eine Suchmaschine extra nur für Newsgoups. Nach Eingabe eines oder besser mehreren Schlagwörtern wird man vielleicht mehr über ein Thema bzw. Problem finden. In der "Power Search" von Deja News kann man wie bei den Web-Suchmaschinen die Suche mit der AND- ("acorn & treffen"), OR- ("stammtisch | treffen"), NOT- ("festplatte &! ide") und NEBENEINANDER- ("scsi ^ festplatte") Verküpfung einschränken.

Die letzte Suchmaschine die ich vorstellen möchte ist Four11 (inzwischen bei Yahoo!). Mit Four11 kann man nach EMail-Adressen suchen. Es gibt mehrere Eingabefelder (Vornamen, Nachnamen, Stadt, US-Bundesstaat, Land, Firma und Domain der EMail-Adresse). Man sollte erst nur den Namen eingeben und dann gegebenfalls die Suche schrittweise einschränken. Falls hier die Suche nicht erfolgreich war, kann man auch in den Newsgoups oder im Web mit einer der anderen Suchmaschinen sein Glück versuchen.

So ich hoffe ich konnte einigen helfen besser mit Internet-Suchmaschinen umzugehen, aber ich konnte nur einen kurzen Überblick schaffen. Um eine Suchmaschine mit all ihren Möglichkeiten zu bedienen muß man wohl oder Übel die Bedienungsanleitungen der jeweiligen Suchmaschine lesen und halt Erfahrung sammeln.

Carlos Michael Santillán

 

Suchmaschinen im Internet
Yahoo! http://www.yahoo.com/
Yahoo! Deutschland http://www.yahoo.de/
AltaVista http://www.altavista.com/
AltaVista Deutsch http://www.altavista.de/
Excite http://www.excite.com/
HotBot http://www.hotbot.com/
Infoseek http://www.infoseek.com/
Archie TH Darmstadt http://archie.th-darmstadt.de/
FTP search http://ftpsearch.ntnu.no/
Filez http://www.filez.com/
ArcArchie http://www.arcsite.de/arcarchie/
Deja News http://www.dejanews.com/
Four11 http://www.four11.com/