Sie können nach jedem Wort oder Ausdruck auf einer Website suchen, indem Sie das Wort oder den Ausdruck in ein Abfrageformular eingeben und auf die Schaltfläche klicken, mit der die Abfrage ausgeführt wird (z. B. die Schaltfläche Suchen im Beispielabfrageformular). In diesem Abschnitt werden folgende Themen
behandelt:
- Boolesche Operatoren und Nähe-Operatoren: Erläutert, wie mit Booleschen und Nähe-Operatoren präzise Abfragen erstellt werden können.
- Platzhalterzeichen: Ermöglicht die Suche nach Seiten mit Wörtern, die einem vorgegebenen Wort ähnlich
sind.
- Volltextabfragen: Beschreibt, wie eine Abfrage auf der Grundlage der Bedeutung eines Ausdrucks anstelle des exakten Wortlauts formuliert werden
kann.
- Vektorraumabfragen: Erläutert, wie Abfrageergebnisse erzielt werden können, die mit einer Liste von Wörtern und Ausdrücken übereinstimmen.
- Eigenschaftswertabfragen: Beschreibt, wie eine Abfrage nach den Eigenschaftswerten einer Datei durchgeführt werden
kann.
- Abfragebeispiele: Gibt Beispiele für unterschiedliche
Abfragen.
- Liste mit Eigenschaftsnamen: Nennt und beschreibt Eigenschaftsnamen, die ständig für Abfragen verfügbar
sind.
Durch Suchvorgänge wird eine Liste von Dateien erstellt, die das Wort oder den Ausdruck unabhängig von der jeweiligen Position im Text enthalten. In dieser Liste stehen die Regeln für das Formulieren von
Abfragen:
- Aufeinander folgende Wörter gelten als ein Ausdruck; sie müssen in dem übereinstimmenden Dokument in derselben Reihenfolge
stehen.
- In den Abfragen wird nicht nach Groß- und Kleinschreibung unterschieden, die Abfragen können demnach mit Groß- oder Kleinbuchstaben geschrieben
werden.
- Sie können nach jedem beliebigen Wort suchen, ausgenommen sind die Wörter der Ausnahmeliste (für Englisch sind diese a, an, and, as und andere häufig vorkommende Wörter), die während einer Suche ignoriert
werden.
- Die Wörter der Ausnahmeliste werden bei Ausdruck- und Nähe-Abfragen wie Platzhalter behandelt. Suchen Sie beispielsweise nach "Word für Windows", können "Word für Windows" und "Word und Windows" als Ergebnis zurückgegeben werden, da für ein nicht signifikantes Wort ist und in der Ausnahmeliste
steht.
- Satzzeichen wie Punkt (.), Doppelpunkt (:), Semikolon (;) und Komma (,) werden bei der Suche
ignoriert.
- Wenn Sonderzeichen wie &, |, ^, #, @, $, (, ) in einer Abfrage verwendet werden, muss die Abfrage in Anführungszeichen (") gesetzt
werden.
- Wenn nach einem Wort oder Ausdruck mit Anführungszeichen gesucht werden soll, muss der gesamte Ausdruck in Anführungszeichen gesetzt werden. Weiterhin müssen um das Wort oder die Wörter, die in Anführungszeichen stehen sollen, noch einmal Anführungszeichen gesetzt werden. Bei "World Wide Web oder ""Web""" wird beispielsweise nach World Wide Web oder "Web"
gesucht.
- Sie können auch Boolesche Operatoren (AND, OR und NOT) und den Nähe-Operator (NEAR) einsetzen, um zusätzliche Daten für die Suche
anzugeben.
- Mit dem Platzhalterzeichen (*) kann nach Wörtern gesucht werden, die ein vorgegebenes Präfix haben. Bei der Abfrage entf* werden Ausdrücke wie
"ENTF", "entfernen" usw. gesucht.
- Volltextabfragen können ohne Rücksicht auf die Abfragesyntax angegeben
werden.
- Vektorraumabfragen können angegeben
werden.
- Es können auch Abfragen von Eigenschaftswerten für ActiveX (OLE) und Dateieigenschaften erstellt
werden.
Mit Booleschen und Nähe-Operatoren kann eine präzisere Abfrage erstellt
werden.
Suche |
Beispiel |
Ergebnisse |
Zwei Begriffe auf derselben Seite |
vocabolario
and grammatica -Oder - vocabolario
& grammatica |
Seiten mit den beiden Wörtern
"vocabolario" und
"grammatica" |
Einer der beiden Begriffe auf einer Seite |
vocabolario
or grammatica -Oder - vocabolario
| grammatica |
Seiten mit den Wörtern
"vocabolario" oder
"grammatica" |
Der erste Begriff ohne den zweiten Begriff |
Boccaccio
and
not Petrarca -Oder- Boccaccio
& ! Petrarca
|
Seiten mit dem Wort "Boccaccio" und ohne das Wort
"Petrarca" |
eiten, bei denen ein Eigenschaftswert abweicht |
not
@size = 100 - Oder - ! @size = 100 |
Seiten, die nicht 100 Byte
umfassen. |
Beide Begriffe auf derselben Seite und in gewissem Abstand voneinander |
vocabolario
near grammatica - Oder - vocabolario
~ grammatica |
Seiten, auf denen das Wort "vocabolario" in der Nähe des Wortes
"grammatica" steht |
Hinweise:
- Durch Hinzufügen von Klammern können Ausdrücke innerhalb einer Abfrage verschachtelt werden. Die Ausdrücke in Klammern werden vor dem Rest der Abfrage
ausgewertet.
- Mit Anführungszeichen (") kann angezeigt werden, dass ein Boolesches oder ein NEAR-Operatorschlüsselwort in der Abfrage ignoriert wird. Bei "Abbott and Costello" werden beispielsweise Seiten gesucht, die diesen Ausdruck enthalten, nicht Seiten, die mit dem Booleschen Ausdruck übereinstimmen. Neben der Funktion als Operator ist das Wort and im Englischen auch ein nicht signifikantes
Wort.
- Der Operator NEAR ist mit dem Operator AND vergleichbar, denn NEAR gibt eine Übereinstimmung zurück, wenn sich beide gesuchten Begriffe auf einer Seite befinden. Der Operator NEAR unterscheidet sich jedoch von AND, da der durch NEAR zugewiesene Rang von der Nähe der Wörter zueinander abhängt. Dies bedeutet, dass der Rang einer Seite, bei der die beiden gesuchten Wörter näher zusammenstehen, höher oder gleich dem Rang einer Seite ist, bei der die Wörter weiter voneinander entfernt sind. Beträgt der Abstand zwischen den gesuchten Wörtern mehr als 50 Wörter, so gilt der Abstand als zu groß, und die Seite wird mit Null
eingestuft.
- Der Operator NOT kann nur nach einem AND-Operator in Inhaltsabfragen verwendet werden; mit ihm können Seiten ausgeschlossen werden, bei denen eine vorherige Inhaltsbeschränkung zutrifft. In Eigenschaftswertabfragen kann der NOT-Operator unabhängig vom AND-Operator eingesetzt
werden.
- Der AND-Operator hat eine höhere Priorität als OR. Die ersten drei Abfragen sind beispielsweise gleich, aber die vierte Abfrage ist anders: a AND b OR c
c OR a AND b c OR (a AND b) (c OR a) AND b.
Anmerkung Die Symbole (&, |, !, ~) und die englischen Schlüsselwörter AND, OR, NOT und NEAR haben in allen von Index Server unterstützten Sprachen dieselben Funktionen. Es stehen auch lokalisierte Schlüsselwörter zur Verfügung, wenn das Gebietsschema des Browsers auf eine der folgenden
Sprachen gesetzt
ist:
Sprache |
Schlüsselwörter |
Deutsch |
UND, ODER, NICHT, NAH |
Französisch |
ET, OU, SANS, PRES |
Italienisch | E, O, NO, VICINO |
Spanisch |
Y, O, NO, CERCA |
Anmerkung Der NEAR-Operator kann nur bei Wörtern oder Ausdrücken eingesetzt
werden.
Mit Platzhaltern können Sie nach Seiten suchen, die ähnliche Wörter wie das vorgegebene Wort
enthalten.
Suche |
Beispiel |
Ergebnisse |
Wörter mit demselben Präfix |
amor* |
Seiten mit Wörtern, die das Präfix
"amor" haben, wie z. B. amore,
amoroso, amoruccio, amorale, amorevole
... usw. |
Wörter mit demselben Stammwort |
andar** |
Seiten mit Wörtern, die dasselbe Stammwort haben wie
"andare", z. B.
"vado", "andiamo", "andato", "vadano"
... usw. |
Das Abfragemodul sucht nach Seiten, die die Wörter und Ausdrücke in einer Volltextabfrage am besten treffen. Dies geschieht durch eine automatische Suche nach Seiten, die mit der Bedeutung übereinstimmen, nicht mit dem exakten Wortlaut der Abfrage. Boolesche, Nähe- und Platzhalter-Operatoren werden innerhalb einer Volltextabfrage ignoriert. Der Volltextabfrage wird
$contents
vorangestellt.
Das Abfragemodul unterstützt Vektorraumabfragen. Vektorabfragen geben Seiten zurück, die mit einer Liste von Wörtern und Ausdrücken übereinstimmen. Der Rang jeder Seite zeigt an, wie gut die Seite mit der Abfrage übereinstimmt.
Suche |
Beispiel |
Ergebnisse |
Seiten, die bestimmte Wörter
enthalten. |
luce, splendore |
Dateien mit Wörtern, die am besten mit den gesuchten Wörtern übereinstimmen |
Seiten, die gewichtete Präfixe, Wörter und Ausdrücke
enthalten. |
splend*, luce[50], raggi[10],
"fede"[400] |
Dateien, die Wörter mit dem Präfix
"splend", die Wörter "luce", "raggi" und den Ausdruck
"fede" enthalten (die Begriffe sind
gewichtet). |
- Die Komponenten in Vektorabfragen sind durch Kommas
getrennt.
- Komponenten in Vektorabfragen können gewichtet werden, indem die Syntax [weight] verwendet
wird.
- Die bei Vektorabfragen zurückgegebenen Seiten müssen nicht alle Begriffe der Abfrage
enthalten.
- Vektorabfragen sind besonders geeignet, wenn die Ergebnisse sortiert
werden.
Mit Eigenschaftswertabfragen kann nach Dateien gesucht werden, deren Eigenschaftswerte mit vorgegebenen Kriterien übereinstimmen. Zu den Eigenschaften, die abgefragt werden können, zählen grundlegende Dateiinformationen wie Dateiname und Dateigröße sowie ActiveX-Eigenschaften wie die Dokumentzusammenfassung (Informationen), die in Dateien gespeichert sind, die durch ActiveX-erkennende Anwendungen erstellt
wurden.
Es gibt zwei Arten von Eigenschaftsabfragen:
- Relationale Eigenschaftsabfragen bestehen aus einem "at"-Zeichen (@), einem Eigenschaftsnamen, einem relationalen Operator und einem Eigenschaftswert. Um nach allen Dateien mit mehr als einer Million Byte zu suchen, können Sie die Abfrage @size > 1000000
ausgeben.
- Eigenschaftsabfragen mit regulärem Ausdruck bestehen aus einem Nummernzeichen (#), einem Eigenschaftsnamen und einem regulären Ausdruck für den Eigenschaftswert. Um beispielsweise nach allen Videodateien (.avi) zu suchen, müssen Sie die Abfrage #filename *.avi ausgeben. Reguläre Ausdrücke stimmen nie mit den besonderen Eigenschaften Contents (#contents) und All (#all) überein. Eigenschaften, die zur Zeit der Abfrage nicht abrufbar sind, können in #-Abfragen nicht verwendet werden. Dazu zählen HTML META-Eigenschaften, die nicht im Eigenschaften-Cache gespeichert
sind.
In diesem Abschnitt werden folgende Themen erläutert:
Den Eigenschaftsnamen geht entweder das "at"-Zeichen (@) oder das Nummernzeichen (#) voran. Verwenden Sie @ für relationale Abfragen und # für Abfragen mit regulären Ausdrücken.
Ist kein Eigenschaftsname angegeben, wird @contents vorausgesetzt.
Folgende Eigenschaften sind für alle Dateien verfügbar:
Eigenschaftsname |
Beschreibung |
All |
Sucht Übereinstimmungen von Wörtern, Ausdrücken und einer beliebigen Eigenschaft |
Contents |
Wörter und Ausdrücke in der Datei |
Filename |
Dateiname |
Size |
Dateigröße |
Write |
Letztes Änderungsdatum der Datei |
Auch ActiveX-Eigenschaftswerte können in Abfragen verwendet werden. Websites mit Dateien, die durch die meisten ActiveX-erkennenden Anwendungen erstellt wurden, können nach den folgenden Eigenschaften abgefragt werden:
Eigenschaftsname |
Beschreibung |
DocTitle |
Titel des Dokuments |
DocSubject |
Thema des Dokuments |
DocAuthor |
Verfasser des Dokuments |
DocKeywords |
Schlüsselwörter des Dokuments |
DocComments |
Kommentare zum Dokument |
Eine vollständige Liste der Eigenschaftsnamen finden Sie unter Liste mit Eigenschaftsnamen weiter hinten in diesem Text.
Relationale Operatoren werden in Abfragen nach relationalen Eigenschaften verwendet.
Suche |
Beispiel |
Ergebnisse |
Eigenschaftswerte in Beziehung zu einem festen Wert |
@size < 100 @size <= 100 @size = 100 @size != 100 @size >= 100 @size > 100 |
Dateien, deren Größe mit der Abfrage übereinstimmt. |
Eigenschaftswerte, bei denen alle Bits eines Satzes an sind. |
@attrib ^a 0x820 |
Komprimierte Dateien, bei denen das Archivbit an ist. |
Eigenschaftswerte, bei denen einige Bitsätze an sind. |
@attrib ^s 0x20 |
Dateien, bei denen das Archivbit an ist |
Suche |
Beispiel |
Ergebnisse |
Ein bestimmter Wert |
@DocAuthor = Giuliano Merz |
Dateien, die von
"Giuliano Merz" verfasst wurden. |
Werte, die mit einem Präfix beginnen. |
#DocAuthor Giu* |
Dateien, deren Verfassername mit
"Giu" beginnt. |
ateien mit einer beliebigen Erweiterung aus einem Satz von Erweiterungen. |
#filename
*.|(exe|,dll|,sys|) |
Dateien mit .exe-, .dll- oder
.sys-Erweiterung |
Dateien, die nach einem bestimmten Datum verändert wurden |
@write > 01/11/11 11:11:00 |
Dateien, die nach dem 11.
November 2001, 11:11 GMT geändert wurden. |
Dateien, die nach einer relativen Datumsangabe geändert wurden. |
@write > -1d2h |
Dateien, die in den letzten 26 Stunden geändert wurden. |
Vektoren, die mit einem Vektor übereinstimmen |
@vectorprop = { 10, 15, 20 } |
ActiveX-Dokumente mit einem vectorprop-Wert von { 10, 15, 20 } |
Vektoren, bei denen jeder Wert mit der Vorgabe übereinstimmt. |
@vectorprop >^a 15 |
ActiveX-Dokumente mit einem vectorprop-Wert, bei dem alle Werte in dem Vektor größer als 15 sind. |
Vektoren, bei denen mindestens ein Wert mit der Vorgabe übereinstimmt |
@vectorprop =^s 15 |
ActiveX-Dokumente mit einem vectorprop-Wert, bei dem mindestens ein Wert 15 beträgt. |
- Vor den Eigenschaftsnamen muss ein Nummernzeichen (#) gesetzt werden, wenn ein regulärer Ausdruck in einem Eigenschaftswert verwendet wird, in allen anderen Fällen ist ein "at"-Zeichen (@) zu verwenden. Der relationale Operator Gleichheitszeichen (=) wird für Abfragen mit einem regulären Ausdruck vorausgesetzt.
- Der Dateiname (#filename) ist die einzige Eigenschaft, die reguläre Ausdrücke mit Platzhaltern zur linken Seite des Textes effizient unterstützt.
- Datums- und Zeitwerte haben das Format tt/mm/jjjj hh:mm:ss oder tt-mm-jjjj hh:mm:ss. Die zwei ersten Zahlen der Jahreszahl und die Zeitangabe können ausgelassen werden. Werden die ersten beiden Zahlen der Jahresangabe ausgelassen, wird 29 oder eine kleinere Zahl als Jahr 2000 interpretiert, und 30 oder eine größere Zahl wird als 1900 interpretiert. Alle Datums- und Zeitangaben sind in mittlerer Zeit Greenwich (Greenwich Mean Time =
GMT) angegeben.
- Datums- und Zeitangaben, die relativ zur aktuellen Zeit sind, können mit einem Minuszeichen (-) gefolgt von Null oder durch weitere Paare von Ganzzahleinheiten und Zeiteinheiten ausgedrückt werden. Zeiteinheiten werden wie folgt ausgedrückt: (j) für Jahre, (m) für Monate, (w) für Wochen, (t) für Tage, (h) für Stunden, (n) für Minuten und (s) für Sekunden. Bei Datumsangaben kann wahlweise ein dreistelliger Wert für Millisekunden hinter dem Wert für Sekunden angegeben werden. Zum Beispiel:
11.11.2001 11:11:11:567
- Währungswerte haben das Format x,y, wobei x der Ganzbetrag des Wertes ist und y der Teilbetrag. Es gibt keine Vorgabe für Einheiten.
- Boolesche Werte sind (t) oder (true) für TRUE und (f) oder (false) für FALSE.
- Vektoren
(VT_VECTOR) werden als öffnende Klammer ({) gefolgt von einer durch Kommas getrennten Werteliste und einer schließenden Klammer (}) ausgedrückt.
- Einzelwertausdrücke, die mit Vektoren verglichen werden, werden als relationaler Operator ausgedrückt, danach folgt (^a) für all of oder (^s) für some of.
- Numerische Werte können dezimal oder hexadezimal sein (0x wird vorangestellt).
- Die contents-Eigenschaft unterstützt keine relationalen Operatoren. Ist ein relationaler Operator angegeben, werden keine Ergebnisse zurückgegeben. Bei der Abfrage @contents Microsoft werden beispielsweise Dokumente gesucht, die Microsoft enthalten, bei @contents=Microsoft wird jedoch kein Dokument zurückgegeben.
Reguläre Ausdrücke in Eigenschaftsabfragen sind folgendermaßen definiert:
- Alle Zeichen außer Sternchen (*), Punkt (.), Fragezeichen (?) und senkrechter Strich (|) stimmen standardmäßig nur mit dem jeweiligen Zeichen überein.
- Reguläre Ausdrücke können in Anführungszeichen stehen (") und müssen sogar in Anführungszeichen stehen, wenn sie ein Leerzeichen ( ) oder eine schließende Klammer ()) enthalten.
- Die Zeichen *, . und ? werden wie bei Windows behandelt; sie stimmen mit einer beliebigen Anzahl von Zahlen, mit (.) oder mit dem Ende einer Zeichenfolge überein sowie mit jedem einzelnen entsprechenden Zeichen.
- Das Zeichen | ist ein Escape-Zeichen. Hinter | folgende Zeichen haben eine besondere Bedeutung:
( öffnet eine Gruppe. Der Klammer muss entsprechend ) folgen.
) schließt eine Gruppe. Der Klammer muss ( vorangehen.
[ öffnet eine Zeichenklasse. Dem Zeichen muss entsprechend ] folgen.
{ öffnet eine gezählte Übereinstimmung. Dem Zeichen muss entsprechend } folgen.
} schließt eine gezählte Übereinstimmung. Dem Zeichen muss entsprechend { vorangehen.
, trennt OR-Abschnitte.
* ordnet keine Übereinstimmung oder mehrere auftretende Übereinstimmungen mit dem vorangehenden Ausdruck zu.
? ordnet keine oder eine auftretende Übereinstimmung mit dem vorangehenden Ausdruck zu.
+ ordnet eine Übereinstimmung oder mehrere auftretende Übereinstimmungen mit dem vorangehenden Ausdruck zu.
Alle anderen Zeichen, einschließlich |, stimmen mit dem jeweiligen Zeichen überein.
- Folgende Zeichen haben in eckige Klammern ([]) gesetzt eine besondere Bedeutung:
^ sucht nach allem außer nach folgenden Klassen. Es muss das erste Zeichen sein.
] sucht nach ]. Ihm kann nur ^ vorangestellt sein, sonst schließt es eine Klasse.
- Bereichsoperator. Davor und dahinter stehen normale Zeichen.
Alle anderen Zeichen stimmen mit den jeweiligen Zeichen überein (oder beginnen bzw. beenden selbst einen Bereich).
- Zwischen geschweiften Klammern ({}) gilt folgende Syntax:
|{m|} sucht exakt nach m Vorfällen des vorangehenden Ausdrucks. (0 < m < 256).
|{m,|} sucht nach mindestens m Vorfällen des vorangehenden Ausdrucks. (1 < m < 256).
|{m,n|} sucht nach m bis n Vorfällen des vorangehenden Ausdrucks (einschließlich). (0 < m < 256, 0 < n < 256).
- Um nach *, . und ? zu suchen, müssen diese Zeichen in Klammern gesetzt werden (z. B.: |[*]Beispiel sucht nach "*Beispiel").
Beispiel |
Ergebnisse |
@size > 1000000 |
Seiten, die größer als eine Million Byte sind. |
@write > 01/11/11 |
Seiten, die nach diesem Datum geändert worden sind. |
mosso |
Seiten mit dem Ausdruck
"mosso". |
"mosso" |
Idem |
@contents mosso |
Idem |
lesto and @size >
10000 |
Seiten mit dem Wort
"lesto", die größer als Zehntausend Byte sind. |
"lesto and @size >
10000" |
Seiten mit dem angegebenen Ausdruck (nicht wie oben). |
#filename
*.avi |
Videodateien (das Präfix # wird verwendet, weil die Abfrage einen regulären Ausdruck enthält). |
@attrib ^s 32 |
Seiten, bei denen das Archivbit
gesetzt ist. |
@docauthor = Giuliano
Merz |
Seiten, die der angegebene Verfasser erstellt hat. |
$contents Perché mi schiante? |
Seiten, die mit der Abfrage übereinstimmen |
@size < 100 &
#filename *.gif |
Dateien im Grafik-Austausch-Format (Graphics Interchange Format = GIF), die kleiner als 100 Byte sind. |
Diese Eigenschaften stehen für Abfragen immer zur Verfügung. Zusätzliche Eigenschaften können abhängig von der Konfiguration des Webservers ebenfalls verfügbar sein.
| Datentyp |
Eigenschaft |
A_HRef |
DBTYPE_WSTR |
DBTYPE_BYREF |
Text für HTML HREF. Dieser Eigenschaftsname wurde für Microsoft® Site Server erstellt und entspricht dem Eigenschaftsnamen HtmlHRef unter Index Server. Kann zwar abgefragt, aber nicht abgerufen werden. |
Access |
VT_FILETIME |
Datum des letzten Zugriffs auf die Datei. |
All | (nicht anwendbar) |
Sucht nach jeder Eigenschaft für eine Zeichenfolge. Kann zwar abgefragt, aber nicht abgerufen werden. |
AllocSize | DBTYPE_I8 |
Größe der Datenträgerzuweisung für eine Datei. |
Attrib | DBTYPE_UI4 |
Dateieigenschaften. In Win32 SDK dokumentiert. |
ClassId | DBTYPE_GUID |
Klassenbezeichnung eines Objekts, z. B. WordPerfect, Word usw. |
Characterization | DBTYPE_WSTR | DBTYPE_BYREF |
Charakterisierung oder Auszug des Dokuments. Wird von Index Server verarbeitet. |
Contents | (nicht anwendbar) |
Hauptinhalt der Datei. Kann zwar abgefragt, aber nicht abgerufen werden. |
Create | VT_FILETIME |
Erstellungsdatum der Datei. |
Directory | DBTYPE_WSTR | DBTYPE_BYREF |
Physischer Pfad der Datei, ohne Dateinamen. |
DocAppName | DBTYPE_WSTR | DBTYPE_BYREF |
Name der Anwendung, mit der die Datei erstellt wurde. |
DocAuthor | DBTYPE_WSTR | DBTYPE_BYREF |
Verfasser des Dokuments. |
DocByteCount | DBTYPE_14 | Anzahl von Byte im Dokument. |
DocCategory | DBTYPE_STR | DBTYPE_BYREF | Dokumentart wie Memo, Zeitplan oder leeres Dokument. |
DocCharCount | DBTYPE_I4 |
Anzahl der Zeichen im Dokument. |
DocComments | DBTYPE_WSTR | DBTYPE_BYREF |
Kommentare über das Dokument. |
DocCompany | DBTYPE_STR | DBTYPE_BYREF | Name des Unternehmens, für das das Dokument geschrieben wurde. |
DocCreatedTm | VT_FILETIME |
Datum, an dem das Dokument erstellt wurde. |
DocEditTime | VT_FILETIME |
Zeit, die insgesamt zum Bearbeiten des Dokuments benötigt wurde. |
DocHiddenCount | DBTYPE_14 | Anzahl der verborgenen Folien in einem Microsoft® PowerPoint-Dokument. |
DocKeywords | DBTYPE_WSTR | DBTYPE_BYREF |
Schlüsselwörter des Dokuments. |
DocLastAuthor | DBTYPE_WSTR | DBTYPE_BYREF |
Benutzer, der das Dokument zuletzt bearbeitet hat. |
DocLastPrinted | VT_FILETIME |
Zeitangabe, wann das Dokument zuletzt gedruckt wurde. |
DocLastSavedTm | VT_FILETIME |
Zeitangabe, wann das Dokument zuletzt gespeichert wurde. |
DocLineCount | DBTYPE_14 | Anzahl der Zeilen in einem Dokument. |
DocManager | DBTYPE_STR | DBTYPE_BYREF | Name des Managers des Verfassers eines Dokuments. |
DocNoteCount | DBTYPE_14 | Anzahl der Seiten mit Anmerkungen in einem PowerPoint-Dokument. |
DocPageCount | DBTYPE_I4 |
Anzahl der Seiten im Dokument. |
DocParaCount | DBTYPE_14 | Anzahl der Absätze in einem Dokument. |
DocPartTitles | DBTYPE_STR | DBTYPE_VECTOR | Namen von Teilen eines Dokuments. Bei Excel gelten beispielsweise die Namen von Arbeitsmappen als Titel von Teilen, bei PowerPoint sind dies Folientitel und bei Word für Windows die Namen der Dokumente im Zentraldokument. |
DocPresentationTarget | DBTYPE_STR|DBTYPE_BYREF | Zielformat (35 mm, Drucker, Video usw.) für eine Präsentation in PowerPoint. |
DocRevNumber | DBTYPE_WSTR | DBTYPE_BYREF |
Aktuelle Versionsnummer des Dokuments. |
DocSlideCount | DBTYPE_14 | Anzahl der Folien in einem PowerPoint-Dokument. |
DocSubject | DBTYPE_WSTR | DBTYPE_BYREF |
Thema des Dokuments. |
DocTemplate | DBTYPE_WSTR | DBTYPE_BYREF |
Name der Vorlage für das Dokument. |
DocTitle | DBTYPE_WSTR | DBTYPE_BYREF |
Titel des Dokuments. |
DocWordCount | DBTYPE_I4 |
Anzahl der Wörter im Dokument. |
FileIndex | DBTYPE_I8 |
Eindeutige ID der Datei. |
FileName | DBTYPE_WSTR | DBTYPE_BYREF |
Dateiname. |
HitCount | DBTYPE_I4 |
Anzahl der Treffer (Wörter, die mit der Abfrage übereinstimmen) in einer Datei. |
HtmlHRef | DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML HREF. Kann zwar abgefragt, aber nicht abgerufen werden. |
HtmlHeading1 | DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML-Dokument im H1-Stil. Kann zwar abgefragt, aber nicht abgerufen werden. |
HtmlHeading2 | DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML-Dokument im H2-Stil. Kann zwar abgefragt, aber nicht abgerufen werden. |
HtmlHeading3 | DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML-Dokument im H3-Stil. Kann zwar abgefragt, aber nicht abgerufen werden. |
HtmlHeading4 | DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML-Dokument im H4-Stil. Kann zwar abgefragt, aber nicht abgerufen werden. |
HtmlHeading5 | DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML-Dokument im H5-Stil. Kann zwar abgefragt, aber nicht abgerufen werden. |
HtmlHeading6 | DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML-Dokument im H6-Stil. Kann zwar abgefragt, aber nicht abgerufen werden. |
Img_Alt |
DBTYPE_WSTR | DBTYPE_BYREF |
Alternativer Text für <IMG>-Marken. Kann zwar abgefragt, aber nicht abgerufen werden. |
Path | DBTYPE_WSTR | DBTYPE_BYREF |
Vollständiger physischer Pfad der Datei, einschließlich Dateinamen. |
Rank | DBTYPE_I4 |
Rang der Zeile. Reicht von 0 bis 1000. Je größer die Zahl, desto besser die Übereinstimmung. |
RankVector | DBTYPE_I4 | DBTYPE_VECTOR |
Ränge der einzelnen Komponenten einer Vektorabfrage. |
ShortFileName | DBTYPE_WSTR | DBTYPE_BYREF |
Kurzer (8.3) Dateiname. |
Size | DBTYPE_I8 |
Dateigröße in Byte. |
USN | DBTYPE_I8 |
Aktualisierungssequenznummer. Nur bei
NTFS-Laufwerken. |
VPath | DBTYPE_WSTR | DBTYPE_BYREF |
Vollständiger virtueller Pfad der Datei, einschließlich Dateinamen. Gibt es mehrere mögliche Pfade, wird die beste Übereinstimmung für diese Abfrage ausgewählt. |
WorkId | DBTYPE_I4 |
Interne ID für die Datei. Wird von Index Server verwendet. |
Write | VT_FILETIME |
Zeitangabe des letzten Schreibzugriffs auf eine Datei. |
Definieren neuer Eigenschaftsnamen
Wenn Sie Eigenschaften definieren möchten, die nicht in der vorherigen Liste vorkommen, müssen Sie sie in einem [Names]-Abschnitt in der .idq-Datei speichern. Wenn Sie diese Eigenschaften in einer Einschränkung, Sortierfestlegung oder als abgerufene Spalte verwenden möchten, müssen Sie sie in der .idq-Datei definieren, indem Sie folgendes Format verwenden:
[Names] #Eigenschaften, die sich nicht in der Standardliste
Eigenschaftsname ( Datentyp) = GUID ["Name" | propid]
In der Syntax steht "Name" für den Eigenschaftsnamen ("Verkauf" im nachfolgenden Beispiel), und propid steht für die in hexadezimalen Zahlen angegebene Eigenschafts-ID. Beachten Sie, dass Sie den Aliasnamen in Anführungszeichen setzen müssen, die Eigenschafts-ID jedoch ohne Anführungszeichen verwendet wird.
Sie möchten beispielsweise als Eigenschaftsnamen eine HTML-Metamarke definieren, die Beutzer als Suchkriterium verwenden können. Die zu definierende Eigenschaft ist Verkauf.
So definieren Sie die Eigenschaft Verkauf
- Fügen Sie in der .idq-Datei im Abschnitt [Names] folgende Zeile hinzu:
MetaBeschreibung(DBTYPE_WSTR) = d1b5d3f0-c0b3-11cf-9a92-00a0c908dbf1 "Verkauf"
Die Angabe für den GUID wird über den Registrierungsparameter MetaTagClsid festgelegt, der sich unter folgendem Pfad befindet:
HKEY_LOCAL_MACHINE
\SYSTEM
\CurrentControlSet
\Control
\HtmlFilter
\MetaTagClsid
- Legen Sie anschließend die Meta-Beschreibung für die HTML-Dateien fest, in denen die Marke enthalten sein soll.
Geben Sie zum Beispiel an, dass Sie alle Dateien mit Verkaufsprognosen suchen möchten:
In Datei1.htm:
<META NAME="Verkauf" CONTENT="Prognosen für 1998">
In Datei2.htm:
<META NAME=" Verkauf" CONTENT=" Prognosen für 1999">
In Datei3.htm:
<META NAME="Verkauf" CONTENT="Vekauf für 1997">
Anmerkung Stellen Sie sicher, dass die META NAME-Marken zwischen die HTML-Marken <head> und </head> am Anfang der Datei gesetzt werden.
Sie können auch nach allen Dateien suchen, die Verkaufsprognosen enthalten. Geben Sie folgende Abfrage aus:
@metabeschreibung prognosen
Diese Abfrage gibt alle Dateien zurück, in denen im CONTENT-Feld das Wort Prognosen enthalten ist. In diesem Beispiel werden somit Datei1.htm und .htm zurückgegeben.
Wenn Sie jedoch nach Verkäufen pro Jahr suchen möchten, um zum Beispiel eine Liste mit den Verkäufen im Jahr 1997 zu erhalten, geben Sie folgende Abfrage aus:
@metabeschreibung 1997
Die Datei 3.htm wird zurückgegeben.
|