Features
Die automatische Indexierung Ihrer Webseiten stellt
sicher, dass die Inhalte der Suchmaschine stets auf dem neuesten Stand
sind. Dabei durchsucht ein W3 SiteSearch Crawler in bestimmten
Abständen (abhängig vom gewählten Paket) automatisch Ihre
Webseiten nach neuen oder veränderten Inhalten und nimmt diese in
die Datenbank der Suchmaschine auf.
Neben der automatischen Indexierung können Sie
die Inhalte der Suchdatenbank auch manuell aktualisieren, wenn sich die
Inhalte Ihrer Webseiten z.B. gerade geändert haben. So können
Sie die Aktualität der Suchdatenbank sicherstellen, ohne auf einen
automatischen Durchlauf des W3 SiteSearch Crawlers warten zu
müssen.
3. Suche in statischen Inhalten
Die Suchmaschine erfasst grundsätzlich alle
statischen Webinhalte, die aus Text bzw. HTML bestehen. Außerdem werden
die Formate PDF, DOC, XLS sowie PPT und PPS erfasst.
4. Suche in dynamischen Inhalten
Inhalte von dynamischen Webseiten werden erfasst,
sofern sie Daten als Text, HTML, PDF, DOC, XLS, PPT bzw. PPS
zurückliefern. Dabei spielt es keine Rolle, mit welcher
Programmiersprache die Seiten umgesetzt werden und ob Sie ihre Inhalte
aus einer Datenbank, anderen Webseiten oder einfachen Dateien
generieren. Es können z.B. folgende Programmiersprachen eingesetzt
werden: Java, Perl, PHP, Python, Ruby, JSP, ASP, MS.Net, TCL, CFML, ...
5. Erfassung von HTTP und HTTPS Links
Der W3 SiteSearch Crawler erfasst normale Webinhalte
über das Protokoll HTTP (Standard-Webprotokoll), aber auch solche
Inhalte, die mittels SSL-Verschlüsselung gesichert und nur mit dem
Protokoll HTTPS übertragen werden können.
6. Erfassung von Titel, Keywords, Description, Content
Bei der Indexierung Ihrer Webseiten erfasst der W3
SiteSearch Crawler Titel, Keywords, Description und den eigentlichen
Inhalt der Webseiten, sofern es sich um HTML-Seiten handelt. Titel und
Description werden später dann für die Anzeige der
Ergebnisliste nach einer Suchanfrage verwendet. D.h. alle Ihre Webseiten
sollten eindeutige und sinnvolle Meta-Tags vorweisen können.
Der W3 SiteSearch Crawler erfasst die Inhalte Ihrer
Webseiten auch dann korrekt, wenn Sie die Seiten in Frames aufgeteilt
haben. Bei der Anzeige der Suchergebnisse wird allerdings nicht der Link
auf die Framedefinition, sondern nur auf den einzelnen Frame
zurückgeliefert.
8. Tippfehlerkorrektur / Wortvorschläge
Die Suchmaschine präsentiert dem Anwender Worte
die so ähnlich klingen wie das von ihm eingegebene Suchwort. Falls
sich der Anwender über die Schreibweise nicht im Klaren ist oder
sich verschrieben hat, erhält er so automatisch von der
Suchmaschine entsprechende Vorschläge, die ihm hoffentlich
weiterhelfen. Die Vorschläge beziehen sich ausschließlich auf
Worte, die auf der jeweiligen Website auch vorkommen und werden mittels
SoundEx und dem Levensthein-Algorithmus berechnet.
Bei W3 SiteSearch handelt es sich um eine
Volltext-Suchmaschine, die neben dem eigentlichen Inhalt einer Webseite
auch den Titel und die Meta-Tags Keywords und Description durchsucht. W3
SiteSearch bietet zwei Such-Modi an:
Normal-Modus
Alle Begriffe sind entweder UND oder ODER verknüpft, Phrasen werden
mittels "..." eingegeben.
Experten-Modus
Es kann eine Boolsche-Suche über mehrere Begriffe durchgeführt
werden. Dabei können folgende Zeichen vor den Suchbegriffen
verwendet werden: (+) das Wort muss vorkommen, (-) das Wort darf nicht
vorkommen, (kein Zeichen) das Wort kann vorkommen, muss aber nicht.
Die Suchergebnisse werden der Relevanz nach aufgelistet. Bei der
Berechnung der Relevanz wird sowohl die Häufigkeit der Vorkommnisse
des Suchwortes, als auch die Länge des Textes berücksichtigt
(auch wenn das Wort nur einmal vorkommt, so ist dies bei einem Text der
nur aus 5 Worten besteht sehr relevant!).
10. Bestimmte Inhalte nicht erfassen
Mittels zweier regulärer Ausdrücke und der
eigentlichen Startadresse (i.d.R. Homepage-URL) kann dem Webcrawler sehr
genau gesagt werden, welche Inhalte erfasst werden sollen und welche
nicht. Die dazu verwendeten regulären Ausdrücke orientieren
sich bei ihrer Notation an regulären Ausdrücken in der
Programmiersprache Perl. Werden die regulären Ausdrücke nicht
angegeben, so wird automatisch die gesamte Website unterhalb der
vorgegebenen Homepage-URL erfasst.
11. W3 SiteSearch Logo auf Ergebnisseite
Im Paket W3 SiteSearch Free wird automatisch auf der
Seite der Suchergebnisse ein W3 SiteSearch Logo eingeblendet. In allen
übrigen Paketen kann diese Einblendung ausgeschaltet werden.
12. W3 SiteSearch Logo im Suchformular
Im Paket W3 SiteSearch Free muss neben dem
Suchformular ein kleines W3 SiteSearch Logo eingeblendet werden. In
allen übrigen Paketen ist diese Einblendung optional.
13. Ergebnisseite anpassbar (Farben, Schriften)
Die Ergebnisliste, die nach einer Suche
zurückgeliefert wird, ist bzgl. der verwendeten Schriftarten und
Farben sowie des Targetframes oder der Fenstergröße
anpassbar. Die Anpassung erfolgt einfach über sogenannte
"Hidden"-Parameter im Suchformular.
14. Eigenes Logo auf Ergebnisseite
Anstelle des W3 SiteSearch Logos kann auf der Seite
der Suchergebnisse auch ein eigenes Logo eingeblendet werden.
15. Eigenes Template für Ergebnisseite
Um die Corporate Identity Ihrer Website zu wahren,
kann für die Ergebnisseite auch ein eigenes Template bereitgestellt
werden. Bestimmte Felder, wie z.B. Trefferliste, Anzahl der Treffer,
Suchworte, ... werden dabei als Platzhalter vorgegeben.
16. Suchstatistik, Suchbegriffe, nicht gefunden
Über Ihren eigenen Userbereich auf der W3
SiteSearch Website wird Ihnen eine detaillierte Statistik für Ihre
Suchmaschine angezeigt. Dabei werden die eingegebenen Suchworte, die
dabei erzielten Treffer, bzw. Suchen ohne Treffer ausgewertet und als
Tabelle und Diagramm dargestellt. Anhand dieser Statistiken sehen Sie
leicht, welche Erwartungen die User an Ihre Seite haben und mit welchen
Begriffen sie an ihr Ziel gelangen wollen. Diese Daten können Sie
wiederum in die Optimierung Ihrer Webseiten mit einfließen lassen.
Mittels des W3 SiteSearch Crawlers kann von der
erfassten Website eine komplette Sitemap erstellt werden, die Sie auch
Ihren Besuchern als Navigationshilfe präsentieren können. In
der Sitemap erhält der User einen Überblick über die
Inhalte der Site und kann direkt zu den entsprechenden Seiten gelangen.
Außerdem können Suchergebnisse auch in der Sitemap
dargestellt werden! Die Sitemap kann auf beliebigen Webseiten eingebaut
werden, Farben und Schriftarten sind dabei natürlich anpassbar.
Bei der regelmäßigen Erfassung Ihrer
Webseiten durch den W3 SiteSearch Crawler erhalten Sie eine Meldung,
sofern der Crawler auf sogenannte Broken Links stößt, d.h.
wenn auf Ihren Webseiten Links stehen, die auf Seiten zeigen, die nicht
(mehr) erreichbar sind. Mit diesen Informationen können Sie Ihre
Webseiten frei von Fehlern halten.
Bei der regelmäßigen Erfassung Ihrer
Webseiten durch den W3 SiteSearch Crawler erhalten Sie eine Meldung,
sofern der Crawler auf sogenannte Broken Images stößt, d.h.
wenn auf Ihren Webseiten Grafiken nicht richtig angezeigt werden. Mit
diesen Informationen können Sie Ihre Webseiten optimieren und
Grafikfehler gehören so schnell der Vergangenheit an.
Sind verschiedene Themen einer Website z.B. in
verschiedenen Verzeichnissen abgelegt, so kann eine Liste von Themen im
Suchformular in einer Auswahl-Box dargestellt werden und der Suchende
wählt selbst, ob er über ein bestimmtes oder alle Themen
suchen möchte. Die Unterteilung Ihrer Inhalte in verschiedene
Themen erfolgt anhand der URL und kann im Userbereich auf der W3
SiteSearch Website eingegeben werden.
Besteht ein Webangebot aus mehreren Webservern mit
unterschiedlichen Webadressen, so kann die gesamte Site über alle
Server vom W3 SiteSearch Crawler erfasst werden und der User kann
wahlweise über einen Server oder auch über das gesamte Angebot
suchen. Dazu wird im Suchformular eine entsprechende Auswahl-Box
dargestellt.
22. Suchstatistik über Teilbereiche bzw. Server
Wenn Sie die W3 SiteSearch Features
"Teilbereichssuche" oder "Suche über mehrere Server" verwenden,
dann stehen Ihnen in der Statistik auch Auswertungen über die
einzelnen Bereiche bzw. Server zur Verfügung sowie natürlich
die Auswertung über die gesamte Site.
23. Werbeeinblendung als Suchergebnis
Diese Funktion ist Ihnen bei der Benutzung einiger
Suchmaschinen bestimmt schon begegnet. Wird ein spezielles Wort als
Suchbegriff eingegeben, so erscheinen bestimmte Treffer immer oben, bzw.
am Rand der Seite werden gezielt kleine Werbebanner dargestellt.
Über den Userbereich von W3 SiteSearch können Sie auch gezielt
URLs und Banner angeben, die bei bestimmten Worten eingeblendet werden
sollen.
Sie haben sehr, sehr viele Webseiten oder Ihre
Inhalte stehen in einem Intranet? Betreiben Sie doch Ihren eigenen W3
SiteSearch Server. Neben der einmaligen Lizenz fallen keine weiteren
Kosten an und Sie können so viele Webseiten erfassen wie Sie
wollen.
Folgende Komponenten sind im Lieferumfang des W3 SiteSearch Servers
enthalten:
- Crawler
- Datenbank
- Searchengine
- Statistische Auswertung der Suchanfragen
- Administrationstool
- Installations- und Betriebsanleitung
Folgende Hardware-Voraussetzungen müssen für den Betrieb mindestens vorhanden sein:
- PC, mind. Intel PIII, 1GHz
- mind. 512 MB RAM
- 20 GB Festplatte
- Netzanbindung mit fester Domain oder IP-Adresse
Folgende Software-Voraussetzungen werden für den Betrieb mindestens vorausgesetzt:
MS Windows Server:
- MS IIS (ASP.NET, Soap-Webservices)
- .Net Framework (C#)
- MS SQL Datenbankserver
oder MySQL 4.x - Adminrechte zur Installation
Linux / Solaris:
- Webserver (z.B. Apache, Roxen, iPlanet, ...)
- Perl 5, PHP4
- MySQL 4.x Datenbankserver
- Userrechte zur Installation von Modulen und Softwarepaketen
25. W3 SiteSearch + W3 Statistics Webstatistik
W3 SiteSearch kann mit der Webstatistik W3 Statistics
kombiniert werden. So erhalten Sie einen genauen Überblick
darüber, welche Suchworte wie häufig eingegeben wurden und
welche Seiten die User nach der Suche aufgerufen haben. Mittels der
Sitemap können so die "Hauptverkehrswege" auf Ihren Webseiten
sichtbar gemacht werden und darüber hinaus stehen Ihnen
natürlich alle W3 Statistics
Analysen bzgl. der Zugriffe, der technischen Fähigkeiten und der
Herkunft des Users zur Verfügung, um Ihr Webangebot zu optimieren
und den Erfolg Ihrer Internet-Investitionen zu messen.
Informationen zu W3 Statistics finden Sie unter:
http://www.w3statistics.de
bzw. http://www.w3solutions.de