Abfragesprache

Sie können nach jedem Wort oder Ausdruck auf einer Website suchen, indem Sie das Wort oder den Ausdruck in ein Abfrageformular eingeben und auf die Schaltfläche klicken, mit der die Abfrage ausgeführt wird (z. B. die Schaltfläche Suchen im Beispielabfrageformular). In diesem Abschnitt werden folgende Themen behandelt:

Boolesche Operatoren und Nähe-Operatoren: Erläutert, wie mit Booleschen und Nähe-Operatoren präzise Abfragen erstellt werden können.
Platzhalterzeichen: Ermöglicht die Suche nach Seiten mit Wörtern, die einem vorgegebenen Wort ähnlich sind.
Volltextabfragen: Beschreibt, wie eine Abfrage auf der Grundlage der Bedeutung eines Ausdrucks anstelle des exakten Wortlauts formuliert werden kann.
Vektorraumabfragen: Erläutert, wie Abfrageergebnisse erzielt werden können, die mit einer Liste von Wörtern und Ausdrücken übereinstimmen.
Eigenschaftswertabfragen: Beschreibt, wie eine Abfrage nach den Eigenschaftswerten einer Datei durchgeführt werden kann.
Abfragebeispiele: Gibt Beispiele für unterschiedliche Abfragen.
Liste mit Eigenschaftsnamen: Nennt und beschreibt Eigenschaftsnamen, die ständig für Abfragen verfügbar sind.

Durch Suchvorgänge wird eine Liste von Dateien erstellt, die das Wort oder den Ausdruck unabhängig von der jeweiligen Position im Text enthalten. In dieser Liste stehen die Regeln für das Formulieren von Abfragen:

Aufeinander folgende Wörter gelten als ein Ausdruck; sie müssen in dem übereinstimmenden Dokument in derselben Reihenfolge stehen.
In den Abfragen wird nicht nach Groß- und Kleinschreibung unterschieden, die Abfragen können demnach mit Groß- oder Kleinbuchstaben geschrieben werden.
Sie können nach jedem beliebigen Wort suchen, ausgenommen sind die Wörter der Ausnahmeliste (für Englisch sind diese a, an, and, as und andere häufig vorkommende Wörter), die während einer Suche ignoriert werden.
Die Wörter der Ausnahmeliste werden bei Ausdruck- und Nähe-Abfragen wie Platzhalter behandelt. Suchen Sie beispielsweise nach "Word für Windows", können "Word für Windows" und "Word und Windows" als Ergebnis zurückgegeben werden, da für ein nicht signifikantes Wort ist und in der Ausnahmeliste steht.
Satzzeichen wie Punkt (.), Doppelpunkt (:), Semikolon (;) und Komma (,) werden bei der Suche ignoriert.
Wenn Sonderzeichen wie &, |, ^, #, @, $, (, ) in einer Abfrage verwendet werden, muss die Abfrage in Anführungszeichen (") gesetzt werden.
Wenn nach einem Wort oder Ausdruck mit Anführungszeichen gesucht werden soll, muss der gesamte Ausdruck in Anführungszeichen gesetzt werden. Weiterhin müssen um das Wort oder die Wörter, die in Anführungszeichen stehen sollen, noch einmal Anführungszeichen gesetzt werden. Bei "World Wide Web oder ""Web""" wird beispielsweise nach World Wide Web oder "Web" gesucht.
Sie können auch Boolesche Operatoren (AND, OR und NOT) und den Nähe-Operator (NEAR) einsetzen, um zusätzliche Daten für die Suche anzugeben.
Mit dem Platzhalterzeichen (*) kann nach Wörtern gesucht werden, die ein vorgegebenes Präfix haben. Bei der Abfrage entf* werden Ausdrücke wie "ENTF", "entfernen" usw. gesucht.
Volltextabfragen können ohne Rücksicht auf die Abfragesyntax angegeben werden.
Vektorraumabfragen können angegeben werden.
Es können auch Abfragen von Eigenschaftswerten für ActiveX™ (OLE) und Dateieigenschaften erstellt werden.

Boolesche Operatoren und Nähe-Operatoren

Mit Booleschen und Nähe-Operatoren kann eine präzisere Abfrage erstellt werden.

Suche	Beispiel	Ergebnisse
Zwei Begriffe auf derselben Seite	`vocabolarioand grammatica` -Oder - `vocabolario` `& grammatica`	Seiten mit den beiden Wörtern "vocabolario" und "grammatica"
Einer der beiden Begriffe auf einer Seite	`vocabolarioor grammatica` -Oder - `vocabolario` `\| grammatica`	Seiten mit den Wörtern "vocabolario" oder "grammatica"
Der erste Begriff ohne den zweiten Begriff	`Boccaccioand not Petrarca` -Oder- `Boccaccio` `& ! Petrarca`	Seiten mit dem Wort "Boccaccio" und ohne das Wort "Petrarca"
eiten, bei denen ein Eigenschaftswert abweicht	`not @size = 100` - Oder - `! @size = 100`	Seiten, die nicht 100 Byte umfassen.
Beide Begriffe auf derselben Seite und in gewissem Abstand voneinander	`vocabolarionear grammatica` - Oder - `vocabolario` `~ grammatica`	Seiten, auf denen das Wort "vocabolario" in der Nähe des Wortes "grammatica" steht

Hinweise:

Durch Hinzufügen von Klammern können Ausdrücke innerhalb einer Abfrage verschachtelt werden. Die Ausdrücke in Klammern werden vor dem Rest der Abfrage ausgewertet.
Mit Anführungszeichen (") kann angezeigt werden, dass ein Boolesches oder ein NEAR-Operatorschlüsselwort in der Abfrage ignoriert wird. Bei "Abbott and Costello" werden beispielsweise Seiten gesucht, die diesen Ausdruck enthalten, nicht Seiten, die mit dem Booleschen Ausdruck übereinstimmen. Neben der Funktion als Operator ist das Wort and im Englischen auch ein nicht signifikantes Wort.
Der Operator NEAR ist mit dem Operator AND vergleichbar, denn NEAR gibt eine Übereinstimmung zurück, wenn sich beide gesuchten Begriffe auf einer Seite befinden. Der Operator NEAR unterscheidet sich jedoch von AND, da der durch NEAR zugewiesene Rang von der Nähe der Wörter zueinander abhängt. Dies bedeutet, dass der Rang einer Seite, bei der die beiden gesuchten Wörter näher zusammenstehen, höher oder gleich dem Rang einer Seite ist, bei der die Wörter weiter voneinander entfernt sind. Beträgt der Abstand zwischen den gesuchten Wörtern mehr als 50 Wörter, so gilt der Abstand als zu groß, und die Seite wird mit Null eingestuft.
Der Operator NOT kann nur nach einem AND-Operator in Inhaltsabfragen verwendet werden; mit ihm können Seiten ausgeschlossen werden, bei denen eine vorherige Inhaltsbeschränkung zutrifft. In Eigenschaftswertabfragen kann der NOT-Operator unabhängig vom AND-Operator eingesetzt werden.
Der AND-Operator hat eine höhere Priorität als OR. Die ersten drei Abfragen sind beispielsweise gleich, aber die vierte Abfrage ist anders: a AND b OR c
c OR a AND b
c OR (a AND b)
(c OR a) AND b.

Anmerkung Die Symbole (&, |, !, ~) und die englischen Schlüsselwörter AND, OR, NOT und NEAR haben in allen von Index Server unterstützten Sprachen dieselben Funktionen. Es stehen auch lokalisierte Schlüsselwörter zur Verfügung, wenn das Gebietsschema des Browsers auf eine der folgenden Sprachen gesetzt ist:

Sprache	Schlüsselwörter
Deutsch	UND, ODER, NICHT, NAH
Französisch	ET, OU, SANS, PRES
Italienisch	E, O, NO, VICINO
Spanisch	Y, O, NO, CERCA

Anmerkung Der NEAR-Operator kann nur bei Wörtern oder Ausdrücken eingesetzt werden.

Platzhalter

Mit Platzhaltern können Sie nach Seiten suchen, die ähnliche Wörter wie das vorgegebene Wort enthalten.

Suche	Beispiel	Ergebnisse
Wörter mit demselben Präfix	`amor*`	Seiten mit Wörtern, die das Präfix "amor" haben, wie z. B. amore, amoroso, amoruccio, amorale, amorevole ... usw.
Wörter mit demselben Stammwort	`andar**`	Seiten mit Wörtern, die dasselbe Stammwort haben wie "andare", z. B. "vado", "andiamo", "andato", "vadano" ... usw.

Volltextabfragen

Das Abfragemodul sucht nach Seiten, die die Wörter und Ausdrücke in einer Volltextabfrage am besten treffen. Dies geschieht durch eine automatische Suche nach Seiten, die mit der Bedeutung übereinstimmen, nicht mit dem exakten Wortlaut der Abfrage. Boolesche, Nähe- und Platzhalter-Operatoren werden innerhalb einer Volltextabfrage ignoriert. Der Volltextabfrage wird $contents vorangestellt.

Suche	Beispiel	Ergebnisse
Dateien, die mit dem Volltext übereinstimmen	`$contents In che anno è morto Leonardo da Vinci?`	Seiten, in denen '`anno`, morire, Leonardo, Vinci' erwähnt sind.

Vektorraumabfragen

Das Abfragemodul unterstützt Vektorraumabfragen. Vektorabfragen geben Seiten zurück, die mit einer Liste von Wörtern und Ausdrücken übereinstimmen. Der Rang jeder Seite zeigt an, wie gut die Seite mit der Abfrage übereinstimmt.

Suche	Beispiel	Ergebnisse
Seiten, die bestimmte Wörter enthalten.	`luce, splendore`	Dateien mit Wörtern, die am besten mit den gesuchten Wörtern übereinstimmen
Seiten, die gewichtete Präfixe, Wörter und Ausdrücke enthalten.	`splend*, luce[50], raggi[10], "fede"[400]`	Dateien, die Wörter mit dem Präfix "splend", die Wörter "luce", "raggi" und den Ausdruck "fede" enthalten (die Begriffe sind gewichtet).

Die Komponenten in Vektorabfragen sind durch Kommas getrennt.
Komponenten in Vektorabfragen können gewichtet werden, indem die Syntax [weight] verwendet wird.
Die bei Vektorabfragen zurückgegebenen Seiten müssen nicht alle Begriffe der Abfrage enthalten.
Vektorabfragen sind besonders geeignet, wenn die Ergebnisse sortiert werden.

Eigenschaftswertabfragen

Mit Eigenschaftswertabfragen kann nach Dateien gesucht werden, deren Eigenschaftswerte mit vorgegebenen Kriterien übereinstimmen. Zu den Eigenschaften, die abgefragt werden können, zählen grundlegende Dateiinformationen wie Dateiname und Dateigröße sowie ActiveX-Eigenschaften wie die Dokumentzusammenfassung (Informationen), die in Dateien gespeichert sind, die durch ActiveX-erkennende Anwendungen erstellt wurden.

Es gibt zwei Arten von Eigenschaftsabfragen:

Relationale Eigenschaftsabfragen bestehen aus einem "at"-Zeichen (@), einem Eigenschaftsnamen, einem relationalen Operator und einem Eigenschaftswert. Um nach allen Dateien mit mehr als einer Million Byte zu suchen, können Sie die Abfrage @size > 1000000 ausgeben.
Eigenschaftsabfragen mit regulärem Ausdruck bestehen aus einem Nummernzeichen (#), einem Eigenschaftsnamen und einem regulären Ausdruck für den Eigenschaftswert. Um beispielsweise nach allen Videodateien (.avi) zu suchen, müssen Sie die Abfrage #filename *.avi ausgeben. Reguläre Ausdrücke stimmen nie mit den besonderen Eigenschaften Contents (#contents) und All (#all) überein. Eigenschaften, die zur Zeit der Abfrage nicht abrufbar sind, können in #-Abfragen nicht verwendet werden. Dazu zählen HTML META-Eigenschaften, die nicht im Eigenschaften-Cache gespeichert sind.

In diesem Abschnitt werden folgende Themen erläutert:

Eigenschaftsnamen
Relationale Operatoren
Eigenschaftswerte

Eigenschaftsnamen

Den Eigenschaftsnamen geht entweder das "at"-Zeichen (@) oder das Nummernzeichen (#) voran. Verwenden Sie @ für relationale Abfragen und # für Abfragen mit regulären Ausdrücken.

Ist kein Eigenschaftsname angegeben, wird @contents vorausgesetzt.

Folgende Eigenschaften sind für alle Dateien verfügbar:

Eigenschaftsname	Beschreibung
All	Sucht Übereinstimmungen von Wörtern, Ausdrücken und einer beliebigen Eigenschaft
Contents	Wörter und Ausdrücke in der Datei
Filename	Dateiname
Size	Dateigröße
Write	Letztes Änderungsdatum der Datei

Auch ActiveX-Eigenschaftswerte können in Abfragen verwendet werden. Websites mit Dateien, die durch die meisten ActiveX-erkennenden Anwendungen erstellt wurden, können nach den folgenden Eigenschaften abgefragt werden:

Eigenschaftsname	Beschreibung
DocTitle	Titel des Dokuments
DocSubject	Thema des Dokuments
DocAuthor	Verfasser des Dokuments
DocKeywords	Schlüsselwörter des Dokuments
DocComments	Kommentare zum Dokument

Eine vollständige Liste der Eigenschaftsnamen finden Sie unter Liste mit Eigenschaftsnamen weiter hinten in diesem Text.

Relationale Operatoren

Relationale Operatoren werden in Abfragen nach relationalen Eigenschaften verwendet.

Suche	Beispiel	Ergebnisse
Eigenschaftswerte in Beziehung zu einem festen Wert	`@size < 100 @size <= 100 @size = 100 @size != 100 @size >= 100 @size > 100`	Dateien, deren Größe mit der Abfrage übereinstimmt.
Eigenschaftswerte, bei denen alle Bits eines Satzes an sind.	`@attrib ^a 0x820`	Komprimierte Dateien, bei denen das Archivbit an ist.
Eigenschaftswerte, bei denen einige Bitsätze an sind.	`@attrib ^s 0x20`	Dateien, bei denen das Archivbit an ist

Eigenschaftswerte

Suche	Beispiel	Ergebnisse
Ein bestimmter Wert	`@DocAuthor = Giuliano Merz`	Dateien, die von "Giuliano Merz" verfasst wurden.
Werte, die mit einem Präfix beginnen.	`#DocAuthor Giu*`	Dateien, deren Verfassername mit "Giu" beginnt.
ateien mit einer beliebigen Erweiterung aus einem Satz von Erweiterungen.	`#filename *.\|(exe\|,dll\|,sys\|)`	Dateien mit .exe-, .dll- oder .sys-Erweiterung
Dateien, die nach einem bestimmten Datum verändert wurden	`@write > 01/11/11 11:11:00`	Dateien, die nach dem 11. November 2001, 11:11 GMT geändert wurden.
Dateien, die nach einer relativen Datumsangabe geändert wurden.	`@write > -1d2h`	Dateien, die in den letzten 26 Stunden geändert wurden.
Vektoren, die mit einem Vektor übereinstimmen	`@vectorprop = { 10, 15, 20 }`	ActiveX-Dokumente mit einem vectorprop-Wert von { 10, 15, 20 }
Vektoren, bei denen jeder Wert mit der Vorgabe übereinstimmt.	`@vectorprop >^a 15`	ActiveX-Dokumente mit einem vectorprop-Wert, bei dem alle Werte in dem Vektor größer als 15 sind.
Vektoren, bei denen mindestens ein Wert mit der Vorgabe übereinstimmt	`@vectorprop =^s 15`	ActiveX-Dokumente mit einem vectorprop-Wert, bei dem mindestens ein Wert 15 beträgt.

Vor den Eigenschaftsnamen muss ein Nummernzeichen (#) gesetzt werden, wenn ein regulärer Ausdruck in einem Eigenschaftswert verwendet wird, in allen anderen Fällen ist ein "at"-Zeichen (@) zu verwenden. Der relationale Operator Gleichheitszeichen (=) wird für Abfragen mit einem regulären Ausdruck vorausgesetzt.
Der Dateiname (#filename) ist die einzige Eigenschaft, die reguläre Ausdrücke mit Platzhaltern zur linken Seite des Textes effizient unterstützt.
Datums- und Zeitwerte haben das Format tt/mm/jjjj hh:mm:ss oder tt-mm-jjjj hh:mm:ss. Die zwei ersten Zahlen der Jahreszahl und die Zeitangabe können ausgelassen werden. Werden die ersten beiden Zahlen der Jahresangabe ausgelassen, wird 29 oder eine kleinere Zahl als Jahr 2000 interpretiert, und 30 oder eine größere Zahl wird als 1900 interpretiert. Alle Datums- und Zeitangaben sind in mittlerer Zeit Greenwich (Greenwich Mean Time = GMT) angegeben.
Datums- und Zeitangaben, die relativ zur aktuellen Zeit sind, können mit einem Minuszeichen (-) gefolgt von Null oder durch weitere Paare von Ganzzahleinheiten und Zeiteinheiten ausgedrückt werden. Zeiteinheiten werden wie folgt ausgedrückt: (j) für Jahre, (m) für Monate, (w) für Wochen, (t) für Tage, (h) für Stunden, (n) für Minuten und (s) für Sekunden. Bei Datumsangaben kann wahlweise ein dreistelliger Wert für Millisekunden hinter dem Wert für Sekunden angegeben werden. Zum Beispiel: 11.11.2001 11:11:11:567
Währungswerte haben das Format x,y, wobei x der Ganzbetrag des Wertes ist und y der Teilbetrag. Es gibt keine Vorgabe für Einheiten.
Boolesche Werte sind (t) oder (true) für TRUE und (f) oder (false) für FALSE.
Vektoren (VT_VECTOR) werden als öffnende Klammer ({) gefolgt von einer durch Kommas getrennten Werteliste und einer schließenden Klammer (}) ausgedrückt.
Einzelwertausdrücke, die mit Vektoren verglichen werden, werden als relationaler Operator ausgedrückt, danach folgt (^a) für all of oder (^s) für some of.
Numerische Werte können dezimal oder hexadezimal sein (0x wird vorangestellt).
Die contents-Eigenschaft unterstützt keine relationalen Operatoren. Ist ein relationaler Operator angegeben, werden keine Ergebnisse zurückgegeben. Bei der Abfrage @contents Microsoft werden beispielsweise Dokumente gesucht, die Microsoft enthalten, bei @contents=Microsoft wird jedoch kein Dokument zurückgegeben.

Reguläre Ausdrücke

Reguläre Ausdrücke in Eigenschaftsabfragen sind folgendermaßen definiert:

Alle Zeichen außer Sternchen (*), Punkt (.), Fragezeichen (?) und senkrechter Strich (|) stimmen standardmäßig nur mit dem jeweiligen Zeichen überein.
Reguläre Ausdrücke können in Anführungszeichen stehen (") und müssen sogar in Anführungszeichen stehen, wenn sie ein Leerzeichen ( ) oder eine schließende Klammer ()) enthalten.
Die Zeichen *, . und ? werden wie bei Windows behandelt; sie stimmen mit einer beliebigen Anzahl von Zahlen, mit (.) oder mit dem Ende einer Zeichenfolge überein sowie mit jedem einzelnen entsprechenden Zeichen.
Das Zeichen | ist ein Escape-Zeichen. Hinter | folgende Zeichen haben eine besondere Bedeutung:

( öffnet eine Gruppe. Der Klammer muss entsprechend ) folgen.

) schließt eine Gruppe. Der Klammer muss ( vorangehen.

[ öffnet eine Zeichenklasse. Dem Zeichen muss entsprechend ] folgen.

{ öffnet eine gezählte Übereinstimmung. Dem Zeichen muss entsprechend } folgen.

} schließt eine gezählte Übereinstimmung. Dem Zeichen muss entsprechend { vorangehen.

, trennt OR-Abschnitte.

* ordnet keine Übereinstimmung oder mehrere auftretende Übereinstimmungen mit dem vorangehenden Ausdruck zu.

? ordnet keine oder eine auftretende Übereinstimmung mit dem vorangehenden Ausdruck zu.

+ ordnet eine Übereinstimmung oder mehrere auftretende Übereinstimmungen mit dem vorangehenden Ausdruck zu.

Alle anderen Zeichen, einschließlich |, stimmen mit dem jeweiligen Zeichen überein.

Folgende Zeichen haben in eckige Klammern ([]) gesetzt eine besondere Bedeutung:

^ sucht nach allem außer nach folgenden Klassen. Es muss das erste Zeichen sein.

] sucht nach ]. Ihm kann nur ^ vorangestellt sein, sonst schließt es eine Klasse.

- Bereichsoperator. Davor und dahinter stehen normale Zeichen.

Alle anderen Zeichen stimmen mit den jeweiligen Zeichen überein (oder beginnen bzw. beenden selbst einen Bereich).

Zwischen geschweiften Klammern ({}) gilt folgende Syntax:

|{m|} sucht exakt nach m Vorfällen des vorangehenden Ausdrucks. (0 < m < 256).

|{m,|} sucht nach mindestens m Vorfällen des vorangehenden Ausdrucks. (1 < m < 256).

|{m,n|} sucht nach m bis n Vorfällen des vorangehenden Ausdrucks (einschließlich). (0 < m < 256, 0 < n < 256).

Um nach *, . und ? zu suchen, müssen diese Zeichen in Klammern gesetzt werden (z. B.: |[*]Beispiel sucht nach "*Beispiel").

Abfragebeispiele

Beispiel	Ergebnisse
`@size > 1000000`	Seiten, die größer als eine Million Byte sind.
`@write > 01/11/11`	Seiten, die nach diesem Datum geändert worden sind.
`mosso`	Seiten mit dem Ausdruck "mosso".
`"mosso"`	Idem
`@contents mosso`	Idem
`lesto and @size > 10000`	Seiten mit dem Wort "lesto", die größer als Zehntausend Byte sind.
`"lesto and @size > 10000"`	Seiten mit dem angegebenen Ausdruck (nicht wie oben).
`#filename *.avi`	Videodateien (das Präfix # wird verwendet, weil die Abfrage einen regulären Ausdruck enthält).
`@attrib ^s 32`	Seiten, bei denen das Archivbit gesetzt ist.
`@docauthor = Giuliano Merz`	Seiten, die der angegebene Verfasser erstellt hat.
`$contents Perché mi schiante?`	Seiten, die mit der Abfrage übereinstimmen
`@size < 100 & #filename *.gif`	Dateien im Grafik-Austausch-Format (Graphics Interchange Format = GIF), die kleiner als 100 Byte sind.

Liste mit Eigenschaftsnamen

Diese Eigenschaften stehen für Abfragen immer zur Verfügung. Zusätzliche Eigenschaften können abhängig von der Konfiguration des Webservers ebenfalls verfügbar sein.

	Datentyp	Eigenschaft
A_HRef	DBTYPE_WSTR \| DBTYPE_BYREF	Text für HTML HREF. Dieser Eigenschaftsname wurde für Microsoft® Site Server erstellt und entspricht dem Eigenschaftsnamen HtmlHRef unter Index Server. Kann zwar abgefragt, aber nicht abgerufen werden.
Access	VT_FILETIME	Datum des letzten Zugriffs auf die Datei.
All	(nicht anwendbar)	Sucht nach jeder Eigenschaft für eine Zeichenfolge. Kann zwar abgefragt, aber nicht abgerufen werden.
AllocSize	DBTYPE_I8	Größe der Datenträgerzuweisung für eine Datei.
Attrib	DBTYPE_UI4	Dateieigenschaften. In Win32 SDK dokumentiert.
ClassId	DBTYPE_GUID	Klassenbezeichnung eines Objekts, z. B. WordPerfect, Word usw.
Characterization	DBTYPE_WSTR \| DBTYPE_BYREF	Charakterisierung oder Auszug des Dokuments. Wird von Index Server verarbeitet.
Contents	(nicht anwendbar)	Hauptinhalt der Datei. Kann zwar abgefragt, aber nicht abgerufen werden.
Create	VT_FILETIME	Erstellungsdatum der Datei.
Directory	DBTYPE_WSTR \| DBTYPE_BYREF	Physischer Pfad der Datei, ohne Dateinamen.
DocAppName	DBTYPE_WSTR \| DBTYPE_BYREF	Name der Anwendung, mit der die Datei erstellt wurde.
DocAuthor	DBTYPE_WSTR \| DBTYPE_BYREF	Verfasser des Dokuments.
DocByteCount	DBTYPE_14	Anzahl von Byte im Dokument.
DocCategory	DBTYPE_STR \| DBTYPE_BYREF	Dokumentart wie Memo, Zeitplan oder leeres Dokument.
DocCharCount	DBTYPE_I4	Anzahl der Zeichen im Dokument.
DocComments	DBTYPE_WSTR \| DBTYPE_BYREF	Kommentare über das Dokument.
DocCompany	DBTYPE_STR \| DBTYPE_BYREF	Name des Unternehmens, für das das Dokument geschrieben wurde.
DocCreatedTm	VT_FILETIME	Datum, an dem das Dokument erstellt wurde.
DocEditTime	VT_FILETIME	Zeit, die insgesamt zum Bearbeiten des Dokuments benötigt wurde.
DocHiddenCount	DBTYPE_14	Anzahl der verborgenen Folien in einem Microsoft® PowerPoint-Dokument.
DocKeywords	DBTYPE_WSTR \| DBTYPE_BYREF	Schlüsselwörter des Dokuments.
DocLastAuthor	DBTYPE_WSTR \| DBTYPE_BYREF	Benutzer, der das Dokument zuletzt bearbeitet hat.
DocLastPrinted	VT_FILETIME	Zeitangabe, wann das Dokument zuletzt gedruckt wurde.
DocLastSavedTm	VT_FILETIME	Zeitangabe, wann das Dokument zuletzt gespeichert wurde.
DocLineCount	DBTYPE_14	Anzahl der Zeilen in einem Dokument.
DocManager	DBTYPE_STR \| DBTYPE_BYREF	Name des Managers des Verfassers eines Dokuments.
DocNoteCount	DBTYPE_14	Anzahl der Seiten mit Anmerkungen in einem PowerPoint-Dokument.
DocPageCount	DBTYPE_I4	Anzahl der Seiten im Dokument.
DocParaCount	DBTYPE_14	Anzahl der Absätze in einem Dokument.
DocPartTitles	DBTYPE_STR \| DBTYPE_VECTOR	Namen von Teilen eines Dokuments. Bei Excel gelten beispielsweise die Namen von Arbeitsmappen als Titel von Teilen, bei PowerPoint sind dies Folientitel und bei Word für Windows die Namen der Dokumente im Zentraldokument.
DocPresentationTarget	DBTYPE_STR\|DBTYPE_BYREF	Zielformat (35 mm, Drucker, Video usw.) für eine Präsentation in PowerPoint.
DocRevNumber	DBTYPE_WSTR \| DBTYPE_BYREF	Aktuelle Versionsnummer des Dokuments.
DocSlideCount	DBTYPE_14	Anzahl der Folien in einem PowerPoint-Dokument.
DocSubject	DBTYPE_WSTR \| DBTYPE_BYREF	Thema des Dokuments.
DocTemplate	DBTYPE_WSTR \| DBTYPE_BYREF	Name der Vorlage für das Dokument.
DocTitle	DBTYPE_WSTR \| DBTYPE_BYREF	Titel des Dokuments.
DocWordCount	DBTYPE_I4	Anzahl der Wörter im Dokument.
FileIndex	DBTYPE_I8	Eindeutige ID der Datei.
FileName	DBTYPE_WSTR \| DBTYPE_BYREF	Dateiname.
HitCount	DBTYPE_I4	Anzahl der Treffer (Wörter, die mit der Abfrage übereinstimmen) in einer Datei.
HtmlHRef	DBTYPE_WSTR \| DBTYPE_BYREF	Text aus HTML HREF. Kann zwar abgefragt, aber nicht abgerufen werden.
HtmlHeading1	DBTYPE_WSTR \| DBTYPE_BYREF	Text aus HTML-Dokument im H1-Stil. Kann zwar abgefragt, aber nicht abgerufen werden.
HtmlHeading2	DBTYPE_WSTR \| DBTYPE_BYREF	Text aus HTML-Dokument im H2-Stil. Kann zwar abgefragt, aber nicht abgerufen werden.
HtmlHeading3	DBTYPE_WSTR \| DBTYPE_BYREF	Text aus HTML-Dokument im H3-Stil. Kann zwar abgefragt, aber nicht abgerufen werden.
HtmlHeading4	DBTYPE_WSTR \| DBTYPE_BYREF	Text aus HTML-Dokument im H4-Stil. Kann zwar abgefragt, aber nicht abgerufen werden.
HtmlHeading5	DBTYPE_WSTR \| DBTYPE_BYREF	Text aus HTML-Dokument im H5-Stil. Kann zwar abgefragt, aber nicht abgerufen werden.
HtmlHeading6	DBTYPE_WSTR \| DBTYPE_BYREF	Text aus HTML-Dokument im H6-Stil. Kann zwar abgefragt, aber nicht abgerufen werden.
Img_Alt	DBTYPE_WSTR \| DBTYPE_BYREF	Alternativer Text für <IMG>-Marken. Kann zwar abgefragt, aber nicht abgerufen werden.
Path	DBTYPE_WSTR \| DBTYPE_BYREF	Vollständiger physischer Pfad der Datei, einschließlich Dateinamen.
Rank	DBTYPE_I4	Rang der Zeile. Reicht von 0 bis 1000. Je größer die Zahl, desto besser die Übereinstimmung.
RankVector	DBTYPE_I4 \| DBTYPE_VECTOR	Ränge der einzelnen Komponenten einer Vektorabfrage.
ShortFileName	DBTYPE_WSTR \| DBTYPE_BYREF	Kurzer (8.3) Dateiname.
Size	DBTYPE_I8	Dateigröße in Byte.
USN	DBTYPE_I8	Aktualisierungssequenznummer. Nur bei NTFS-Laufwerken.
VPath	DBTYPE_WSTR \| DBTYPE_BYREF	Vollständiger virtueller Pfad der Datei, einschließlich Dateinamen. Gibt es mehrere mögliche Pfade, wird die beste Übereinstimmung für diese Abfrage ausgewählt.
WorkId	DBTYPE_I4	Interne ID für die Datei. Wird von Index Server verwendet.
Write	VT_FILETIME	Zeitangabe des letzten Schreibzugriffs auf eine Datei.

Definieren neuer Eigenschaftsnamen

Wenn Sie Eigenschaften definieren möchten, die nicht in der vorherigen Liste vorkommen, müssen Sie sie in einem [Names]-Abschnitt in der .idq-Datei speichern. Wenn Sie diese Eigenschaften in einer Einschränkung, Sortierfestlegung oder als abgerufene Spalte verwenden möchten, müssen Sie sie in der .idq-Datei definieren, indem Sie folgendes Format verwenden:

[Names]
#Eigenschaften, die sich nicht in der Standardliste
Eigenschaftsname ( Datentyp) = GUID ["Name" | propid]

In der Syntax steht "Name" für den Eigenschaftsnamen ("Verkauf" im nachfolgenden Beispiel), und propid steht für die in hexadezimalen Zahlen angegebene Eigenschafts-ID. Beachten Sie, dass Sie den Aliasnamen in Anführungszeichen setzen müssen, die Eigenschafts-ID jedoch ohne Anführungszeichen verwendet wird.

Sie möchten beispielsweise als Eigenschaftsnamen eine HTML-Metamarke definieren, die Beutzer als Suchkriterium verwenden können. Die zu definierende Eigenschaft ist Verkauf.

So definieren Sie die Eigenschaft Verkauf

Fügen Sie in der .idq-Datei im Abschnitt [Names] folgende Zeile hinzu:

MetaBeschreibung(DBTYPE_WSTR) = d1b5d3f0-c0b3-11cf-9a92-00a0c908dbf1 "Verkauf"

Die Angabe für den GUID wird über den Registrierungsparameter MetaTagClsid festgelegt, der sich unter folgendem Pfad befindet:

HKEY_LOCAL_MACHINE
\SYSTEM
 \CurrentControlSet
  \Control
   \HtmlFilter
    \MetaTagClsid

Legen Sie anschließend die Meta-Beschreibung für die HTML-Dateien fest, in denen die Marke enthalten sein soll.

Geben Sie zum Beispiel an, dass Sie alle Dateien mit Verkaufsprognosen suchen möchten:

In Datei1.htm:

In Datei2.htm:

In Datei3.htm:

Anmerkung Stellen Sie sicher, dass die META NAME-Marken zwischen die HTML-Marken <head> und </head> am Anfang der Datei gesetzt werden.

Sie können auch nach allen Dateien suchen, die Verkaufsprognosen enthalten. Geben Sie folgende Abfrage aus:

@metabeschreibung prognosen

Diese Abfrage gibt alle Dateien zurück, in denen im CONTENT-Feld das Wort Prognosen enthalten ist. In diesem Beispiel werden somit Datei1.htm und .htm zurückgegeben.

Wenn Sie jedoch nach Verkäufen pro Jahr suchen möchten, um zum Beispiel eine Liste mit den Verkäufen im Jahr 1997 zu erhalten, geben Sie folgende Abfrage aus:

@metabeschreibung 1997

Die Datei 3.htm wird zurückgegeben.

Dr. Giuliano Merz Università di Zurigo / Istituto di Romanistica Universität Zürich / Romanisches Seminar Lezioni & Materiali / LV & Materialien

Definieren neuer Eigenschaftsnamen

Dr. Giuliano Merz
Università di Zurigo / Istituto di Romanistica
Universität Zürich / Romanisches Seminar
Lezioni & Materiali / LV & Materialien