CULTURITALIA - civiltà, letteratura, lingua/linguistica italiane

civiltà, letteratura & lingua / linguistica
a cura di
Lois Harrasser
& Giuliano Merz


 

GIULIANO MERZ:  ITALIANISTICA - bibliografie, materiali, progetto concordanze

Dr. Giuliano Merz
Università di Zurigo / Istituto di Romanistica

Universität Zürich / Romanisches
Seminar
Lezioni & Materiali / LV & Materialien

 

Suchen / Finden 
(in allen Dokumenten der Homepage Culturitalia/GMERZ)

Abfragesprache

Sie können nach jedem Wort oder Ausdruck auf einer Website suchen, indem Sie das Wort oder den Ausdruck in ein Abfrageformular eingeben und auf die Schaltfläche klicken, mit der die Abfrage ausgeführt wird (z. B. die Schaltfläche Suchen im Beispielabfrageformular). In diesem Abschnitt werden folgende Themen behandelt:

  • Boolesche Operatoren und Nähe-Operatoren: Erläutert, wie mit Booleschen und Nähe-Operatoren präzise Abfragen erstellt werden können.
  • Platzhalterzeichen: Ermöglicht die Suche nach Seiten mit Wörtern, die einem vorgegebenen Wort ähnlich sind.
  • Volltextabfragen: Beschreibt, wie eine Abfrage auf der Grundlage der Bedeutung eines Ausdrucks anstelle des exakten Wortlauts formuliert werden kann.
  • Vektorraumabfragen: Erläutert, wie Abfrageergebnisse erzielt werden können, die mit einer Liste von Wörtern und Ausdrücken übereinstimmen.
  • Eigenschaftswertabfragen: Beschreibt, wie eine Abfrage nach den Eigenschaftswerten einer Datei durchgeführt werden kann.
  • Abfragebeispiele: Gibt Beispiele für unterschiedliche Abfragen.
  • Liste mit Eigenschaftsnamen: Nennt und beschreibt Eigenschaftsnamen, die ständig für Abfragen verfügbar sind.

Durch Suchvorgänge wird eine Liste von Dateien erstellt, die das Wort oder den Ausdruck unabhängig von der jeweiligen Position im Text enthalten. In dieser Liste stehen die Regeln für das Formulieren von Abfragen:

  • Aufeinander folgende Wörter gelten als ein Ausdruck; sie müssen in dem übereinstimmenden Dokument in derselben Reihenfolge stehen.
  • In den Abfragen wird nicht nach Groß- und Kleinschreibung unterschieden, die Abfragen können demnach mit Groß- oder Kleinbuchstaben geschrieben werden.
  • Sie können nach jedem beliebigen Wort suchen, ausgenommen sind die Wörter der Ausnahmeliste (für Englisch sind diese a, an, and, as und andere häufig vorkommende Wörter), die während einer Suche ignoriert werden.
  • Die Wörter der Ausnahmeliste werden bei Ausdruck- und Nähe-Abfragen wie Platzhalter behandelt. Suchen Sie beispielsweise nach "Word für Windows", können "Word für Windows" und "Word und Windows" als Ergebnis zurückgegeben werden, da für ein nicht signifikantes Wort ist und in der Ausnahmeliste steht.
  • Satzzeichen wie Punkt (.), Doppelpunkt (:), Semikolon (;) und Komma (,) werden bei der Suche ignoriert.
  • Wenn Sonderzeichen wie &, |, ^, #, @, $, (, ) in einer Abfrage verwendet werden, muss die Abfrage in Anführungszeichen (") gesetzt werden.
  • Wenn nach einem Wort oder Ausdruck mit Anführungszeichen gesucht werden soll, muss der gesamte Ausdruck in Anführungszeichen gesetzt werden. Weiterhin müssen um das Wort oder die Wörter, die in Anführungszeichen stehen sollen, noch einmal Anführungszeichen gesetzt werden. Bei "World Wide Web oder ""Web""" wird beispielsweise nach World Wide Web oder "Web" gesucht.
  • Sie können auch Boolesche Operatoren (AND, OR und NOT) und den Nähe-Operator (NEAR) einsetzen, um zusätzliche Daten für die Suche anzugeben.
  • Mit dem Platzhalterzeichen (*) kann nach Wörtern gesucht werden, die ein vorgegebenes Präfix haben. Bei der Abfrage entf* werden Ausdrücke wie "ENTF", "entfernen" usw. gesucht.
  • Volltextabfragen können ohne Rücksicht auf die Abfragesyntax angegeben werden.
  • Vektorraumabfragen können angegeben werden.
  • Es können auch Abfragen von Eigenschaftswerten für ActiveX™ (OLE) und Dateieigenschaften erstellt werden.

Boolesche Operatoren und Nähe-Operatoren

Mit Booleschen und Nähe-Operatoren kann eine präzisere Abfrage erstellt werden.

Suche Beispiel Ergebnisse
Zwei Begriffe auf derselben Seite vocabolario and grammatica
-Oder -
vocabolario & grammatica
Seiten mit den beiden Wörtern "vocabolario" und "grammatica"
Einer der beiden Begriffe auf einer Seite vocabolario or grammatica
-Oder -
vocabolario | grammatica
Seiten mit den Wörtern "vocabolario" oder "grammatica"
Der erste Begriff ohne den zweiten Begriff Boccaccio and not Petrarca
-Oder-
Boccaccio & ! Petrarca
Seiten mit dem Wort "Boccaccio" und ohne das Wort "Petrarca"
eiten, bei denen ein Eigenschaftswert abweicht not @size = 100
- Oder -
! @size = 100
Seiten, die nicht 100 Byte umfassen.
Beide Begriffe auf derselben Seite und in gewissem Abstand voneinander vocabolario near grammatica
- Oder -
vocabolario ~ grammatica
Seiten, auf denen das Wort "vocabolario" in der Nähe des Wortes "grammatica" steht

Hinweise:

  • Durch Hinzufügen von Klammern können Ausdrücke innerhalb einer Abfrage verschachtelt werden. Die Ausdrücke in Klammern werden vor dem Rest der Abfrage ausgewertet.
  • Mit Anführungszeichen (") kann angezeigt werden, dass ein Boolesches oder ein NEAR-Operatorschlüsselwort in der Abfrage ignoriert wird. Bei "Abbott and Costello" werden beispielsweise Seiten gesucht, die diesen Ausdruck enthalten, nicht Seiten, die mit dem Booleschen Ausdruck übereinstimmen. Neben der Funktion als Operator ist das Wort and im Englischen auch ein nicht signifikantes Wort.
  • Der Operator NEAR ist mit dem Operator AND vergleichbar, denn NEAR gibt eine Übereinstimmung zurück, wenn sich beide gesuchten Begriffe auf einer Seite befinden. Der Operator NEAR unterscheidet sich jedoch von AND, da der durch NEAR zugewiesene Rang von der Nähe der Wörter zueinander abhängt. Dies bedeutet, dass der Rang einer Seite, bei der die beiden gesuchten Wörter näher zusammenstehen, höher oder gleich dem Rang einer Seite ist, bei der die Wörter weiter voneinander entfernt sind. Beträgt der Abstand zwischen den gesuchten Wörtern mehr als 50 Wörter, so gilt der Abstand als zu groß, und die Seite wird mit Null eingestuft.
  • Der Operator NOT kann nur nach einem AND-Operator in Inhaltsabfragen verwendet werden; mit ihm können Seiten ausgeschlossen werden, bei denen eine vorherige Inhaltsbeschränkung zutrifft. In Eigenschaftswertabfragen kann der NOT-Operator unabhängig vom AND-Operator eingesetzt werden.
  • Der AND-Operator hat eine höhere Priorität als OR. Die ersten drei Abfragen sind beispielsweise gleich, aber die vierte Abfrage ist anders: a AND b OR c
    c OR a AND b
    c OR (a AND b)
    (c OR a) AND b.

Anmerkung   Die Symbole (&, |, !, ~) und die englischen Schlüsselwörter AND, OR, NOT und NEAR haben in allen von Index Server unterstützten Sprachen dieselben Funktionen. Es stehen auch lokalisierte Schlüsselwörter zur Verfügung, wenn das Gebietsschema des Browsers auf eine der folgenden Sprachen gesetzt ist:

Sprache Schlüsselwörter
Deutsch UND, ODER, NICHT, NAH
Französisch ET, OU, SANS, PRES
ItalienischE, O, NO, VICINO
Spanisch Y, O, NO, CERCA

 

Anmerkung   Der NEAR-Operator kann nur bei Wörtern oder Ausdrücken eingesetzt werden.

Platzhalter

Mit Platzhaltern können Sie nach Seiten suchen, die ähnliche Wörter wie das vorgegebene Wort enthalten.

Suche Beispiel Ergebnisse
Wörter mit demselben Präfix amor* Seiten mit Wörtern, die das Präfix "amor" haben, wie z. B. amore, amoroso,  amoruccio, amorale, amorevole ... usw.
Wörter mit demselben Stammwort andar** Seiten mit Wörtern, die dasselbe Stammwort haben wie "andare", z. B. "vado", "andiamo", "andato", "vadano" ... usw.

Volltextabfragen

Das Abfragemodul sucht nach Seiten, die die Wörter und Ausdrücke in einer Volltextabfrage am besten treffen. Dies geschieht durch eine automatische Suche nach Seiten, die mit der Bedeutung übereinstimmen, nicht mit dem exakten Wortlaut der Abfrage. Boolesche, Nähe- und Platzhalter-Operatoren werden innerhalb einer Volltextabfrage ignoriert. Der Volltextabfrage wird $contents vorangestellt.

Suche Beispiel Ergebnisse
Dateien, die mit dem Volltext übereinstimmen $contents In che anno è morto Leonardo da Vinci? Seiten, in denen 'anno, morire, Leonardo, Vinci' erwähnt sind.

Vektorraumabfragen

Das Abfragemodul unterstützt Vektorraumabfragen. Vektorabfragen geben Seiten zurück, die mit einer Liste von Wörtern und Ausdrücken übereinstimmen. Der Rang jeder Seite zeigt an, wie gut die Seite mit der Abfrage übereinstimmt.

Suche Beispiel Ergebnisse
Seiten, die bestimmte Wörter enthalten. luce, splendore Dateien mit Wörtern, die am besten mit den gesuchten Wörtern übereinstimmen
Seiten, die gewichtete Präfixe, Wörter und Ausdrücke enthalten. splend*, luce[50], raggi[10], "fede"[400] Dateien, die Wörter mit dem Präfix "splend", die Wörter "luce", "raggi" und den Ausdruck "fede" enthalten (die Begriffe sind gewichtet).

 

  • Die Komponenten in Vektorabfragen sind durch Kommas getrennt.
  • Komponenten in Vektorabfragen können gewichtet werden, indem die Syntax [weight] verwendet wird.
  • Die bei Vektorabfragen zurückgegebenen Seiten müssen nicht alle Begriffe der Abfrage enthalten.
  • Vektorabfragen sind besonders geeignet, wenn die Ergebnisse sortiert werden.

Eigenschaftswertabfragen

Mit Eigenschaftswertabfragen kann nach Dateien gesucht werden, deren Eigenschaftswerte mit vorgegebenen Kriterien übereinstimmen. Zu den Eigenschaften, die abgefragt werden können, zählen grundlegende Dateiinformationen wie Dateiname und Dateigröße sowie ActiveX-Eigenschaften wie die Dokumentzusammenfassung (Informationen), die in Dateien gespeichert sind, die durch ActiveX-erkennende Anwendungen erstellt wurden.

Es gibt zwei Arten von Eigenschaftsabfragen:

  • Relationale Eigenschaftsabfragen bestehen aus einem "at"-Zeichen (@), einem Eigenschaftsnamen, einem relationalen Operator und einem Eigenschaftswert. Um nach allen Dateien mit mehr als einer Million Byte zu suchen, können Sie die Abfrage @size > 1000000 ausgeben.
  • Eigenschaftsabfragen mit regulärem Ausdruck bestehen aus einem Nummernzeichen (#), einem Eigenschaftsnamen und einem regulären Ausdruck für den Eigenschaftswert. Um beispielsweise nach allen Videodateien (.avi) zu suchen, müssen Sie die Abfrage #filename *.avi ausgeben. Reguläre Ausdrücke stimmen nie mit den besonderen Eigenschaften Contents (#contents) und All (#all) überein. Eigenschaften, die zur Zeit der Abfrage nicht abrufbar sind, können in #-Abfragen nicht verwendet werden. Dazu zählen HTML META-Eigenschaften, die nicht im Eigenschaften-Cache gespeichert sind.

In diesem Abschnitt werden folgende Themen erläutert:

Eigenschaftsnamen

Den Eigenschaftsnamen geht entweder das "at"-Zeichen (@) oder das Nummernzeichen (#) voran. Verwenden Sie @ für relationale Abfragen und # für Abfragen mit regulären Ausdrücken.

Ist kein Eigenschaftsname angegeben, wird @contents vorausgesetzt.

Folgende Eigenschaften sind für alle Dateien verfügbar:

Eigenschaftsname Beschreibung
All Sucht Übereinstimmungen von Wörtern, Ausdrücken und einer beliebigen Eigenschaft
Contents Wörter und Ausdrücke in der Datei
Filename Dateiname
Size Dateigröße
Write Letztes Änderungsdatum der Datei

Auch ActiveX-Eigenschaftswerte können in Abfragen verwendet werden. Websites mit Dateien, die durch die meisten ActiveX-erkennenden Anwendungen erstellt wurden, können nach den folgenden Eigenschaften abgefragt werden:

Eigenschaftsname Beschreibung
DocTitle Titel des Dokuments
DocSubject Thema des Dokuments
DocAuthor Verfasser des Dokuments
DocKeywords Schlüsselwörter des Dokuments
DocComments Kommentare zum Dokument

Eine vollständige Liste der Eigenschaftsnamen finden Sie unter Liste mit Eigenschaftsnamen weiter hinten in diesem Text.

Relationale Operatoren

Relationale Operatoren werden in Abfragen nach relationalen Eigenschaften verwendet.

Suche Beispiel Ergebnisse
Eigenschaftswerte in Beziehung zu einem festen Wert @size < 100
@size <= 100
@size = 100
@size != 100
@size >= 100
@size > 100
Dateien, deren Größe mit der Abfrage übereinstimmt.
Eigenschaftswerte, bei denen alle Bits eines Satzes an sind. @attrib ^a 0x820 Komprimierte Dateien, bei denen das Archivbit an ist.
Eigenschaftswerte, bei denen einige Bitsätze an sind. @attrib ^s 0x20 Dateien, bei denen das Archivbit an ist

Eigenschaftswerte

Suche Beispiel Ergebnisse
Ein bestimmter Wert @DocAuthor = Giuliano Merz Dateien, die von "Giuliano Merz" verfasst wurden.
Werte, die mit einem Präfix beginnen. #DocAuthor Giu* Dateien, deren Verfassername mit "Giu" beginnt.
ateien mit einer beliebigen Erweiterung aus einem Satz von Erweiterungen. #filename *.|(exe|,dll|,sys|) Dateien mit .exe-, .dll- oder .sys-Erweiterung
Dateien, die nach einem bestimmten Datum verändert wurden @write > 01/11/11 11:11:00 Dateien, die nach dem 11. November 2001, 11:11 GMT geändert wurden.
Dateien, die nach einer relativen Datumsangabe geändert wurden. @write > -1d2h Dateien, die in den letzten 26 Stunden geändert wurden.
Vektoren, die mit einem Vektor übereinstimmen @vectorprop = { 10, 15, 20 } ActiveX-Dokumente mit einem vectorprop-Wert von { 10, 15, 20 }
Vektoren, bei denen jeder Wert mit der Vorgabe übereinstimmt. @vectorprop >^a 15 ActiveX-Dokumente mit einem vectorprop-Wert, bei dem alle Werte in dem Vektor größer als 15 sind.
Vektoren, bei denen mindestens ein Wert mit der Vorgabe übereinstimmt @vectorprop =^s 15 ActiveX-Dokumente mit einem vectorprop-Wert, bei dem mindestens ein Wert 15 beträgt.

 

  • Vor den Eigenschaftsnamen muss ein Nummernzeichen (#) gesetzt werden, wenn ein regulärer Ausdruck in einem Eigenschaftswert verwendet wird, in allen anderen Fällen ist ein "at"-Zeichen (@) zu verwenden. Der relationale Operator Gleichheitszeichen (=) wird für Abfragen mit einem regulären Ausdruck vorausgesetzt.
  • Der Dateiname (#filename) ist die einzige Eigenschaft, die reguläre Ausdrücke mit Platzhaltern zur linken Seite des Textes effizient unterstützt.
  • Datums- und Zeitwerte haben das Format tt/mm/jjjj hh:mm:ss oder tt-mm-jjjj hh:mm:ss. Die zwei ersten Zahlen der Jahreszahl und die Zeitangabe können ausgelassen werden. Werden die ersten beiden Zahlen der Jahresangabe ausgelassen, wird 29 oder eine kleinere Zahl als Jahr 2000 interpretiert, und 30 oder eine größere Zahl wird als 1900 interpretiert. Alle Datums- und Zeitangaben sind in mittlerer Zeit Greenwich (Greenwich Mean Time = GMT) angegeben.
  • Datums- und Zeitangaben, die relativ zur aktuellen Zeit sind, können mit einem Minuszeichen (-) gefolgt von Null oder durch weitere Paare von Ganzzahleinheiten und Zeiteinheiten ausgedrückt werden. Zeiteinheiten werden wie folgt ausgedrückt: (j) für Jahre, (m) für Monate, (w) für Wochen, (t) für Tage, (h) für Stunden, (n) für Minuten und (s) für Sekunden. Bei Datumsangaben kann wahlweise ein dreistelliger Wert für Millisekunden hinter dem Wert für Sekunden angegeben werden. Zum Beispiel: 11.11.2001 11:11:11:567
  • Währungswerte haben das Format x,y, wobei x der Ganzbetrag des Wertes ist und y der Teilbetrag. Es gibt keine Vorgabe für Einheiten.
  • Boolesche Werte sind (t) oder (true) für TRUE und (f) oder (false) für FALSE.
  • Vektoren (VT_VECTOR) werden als öffnende Klammer ({) gefolgt von einer durch Kommas getrennten Werteliste und einer schließenden Klammer (}) ausgedrückt.
  • Einzelwertausdrücke, die mit Vektoren verglichen werden, werden als relationaler Operator ausgedrückt, danach folgt (^a) für all of oder (^s) für some of.
  • Numerische Werte können dezimal oder hexadezimal sein (0x wird vorangestellt).
  • Die contents-Eigenschaft unterstützt keine relationalen Operatoren. Ist ein relationaler Operator angegeben, werden keine Ergebnisse zurückgegeben. Bei der Abfrage @contents Microsoft werden beispielsweise Dokumente gesucht, die Microsoft enthalten, bei @contents=Microsoft wird jedoch kein Dokument zurückgegeben.

Reguläre Ausdrücke

Reguläre Ausdrücke in Eigenschaftsabfragen sind folgendermaßen definiert:

  • Alle Zeichen außer Sternchen (*), Punkt (.), Fragezeichen (?) und senkrechter Strich (|) stimmen standardmäßig nur mit dem jeweiligen Zeichen überein.
  • Reguläre Ausdrücke können in Anführungszeichen stehen (") und müssen sogar in Anführungszeichen stehen, wenn sie ein Leerzeichen ( ) oder eine schließende Klammer ()) enthalten.
  • Die Zeichen *, . und ? werden wie bei Windows behandelt; sie stimmen mit einer beliebigen Anzahl von Zahlen, mit (.) oder mit dem Ende einer Zeichenfolge überein sowie mit jedem einzelnen entsprechenden Zeichen.
  • Das Zeichen | ist ein Escape-Zeichen. Hinter | folgende Zeichen haben eine besondere Bedeutung:
  • ( öffnet eine Gruppe. Der Klammer muss entsprechend ) folgen.

    ) schließt eine Gruppe. Der Klammer muss ( vorangehen.

    [ öffnet eine Zeichenklasse. Dem Zeichen muss entsprechend ] folgen.

    { öffnet eine gezählte Übereinstimmung. Dem Zeichen muss entsprechend } folgen.

    } schließt eine gezählte Übereinstimmung. Dem Zeichen muss entsprechend { vorangehen.

    , trennt OR-Abschnitte.

    * ordnet keine Übereinstimmung oder mehrere auftretende Übereinstimmungen mit dem vorangehenden Ausdruck zu.

    ? ordnet keine oder eine auftretende Übereinstimmung mit dem vorangehenden Ausdruck zu.

    + ordnet eine Übereinstimmung oder mehrere auftretende Übereinstimmungen mit dem vorangehenden Ausdruck zu.

    Alle anderen Zeichen, einschließlich |, stimmen mit dem jeweiligen Zeichen überein.

  • Folgende Zeichen haben in eckige Klammern ([]) gesetzt eine besondere Bedeutung:
  • ^ sucht nach allem außer nach folgenden Klassen. Es muss das erste Zeichen sein.

    ] sucht nach ]. Ihm kann nur ^ vorangestellt sein, sonst schließt es eine Klasse.

    - Bereichsoperator. Davor und dahinter stehen normale Zeichen.

    Alle anderen Zeichen stimmen mit den jeweiligen Zeichen überein (oder beginnen bzw. beenden selbst einen Bereich).

  • Zwischen geschweiften Klammern ({}) gilt folgende Syntax:
  • |{m|} sucht exakt nach m Vorfällen des vorangehenden Ausdrucks. (0 < m < 256).

    |{m,|} sucht nach mindestens m Vorfällen des vorangehenden Ausdrucks. (1 < m < 256).

    |{m,n|} sucht nach m bis n Vorfällen des vorangehenden Ausdrucks (einschließlich). (0 < m < 256, 0 < n < 256).

  • Um nach *, . und ? zu suchen, müssen diese Zeichen in Klammern gesetzt werden (z. B.: |[*]Beispiel sucht nach "*Beispiel").

Abfragebeispiele

Beispiel Ergebnisse
@size > 1000000 Seiten, die größer als eine Million Byte sind.
@write > 01/11/11 Seiten, die nach diesem Datum geändert worden sind.
mosso Seiten mit dem Ausdruck "mosso".
"mosso" Idem
@contents mosso Idem
lesto and @size > 10000 Seiten mit dem Wort "lesto", die größer als Zehntausend  Byte sind.
"lesto and @size > 10000" Seiten mit dem angegebenen Ausdruck (nicht wie oben).
#filename *.avi Videodateien (das Präfix # wird verwendet, weil die Abfrage einen regulären Ausdruck enthält).
@attrib ^s 32 Seiten, bei denen das Archivbit gesetzt ist.
@docauthor = Giuliano  Merz Seiten, die der angegebene Verfasser erstellt hat.
$contents Perché mi schiante? Seiten, die mit der Abfrage übereinstimmen
@size < 100 & #filename *.gif Dateien im Grafik-Austausch-Format (Graphics Interchange Format = GIF), die kleiner als 100 Byte sind.

Liste mit Eigenschaftsnamen

Diese Eigenschaften stehen für Abfragen immer zur Verfügung. Zusätzliche Eigenschaften können abhängig von der Konfiguration des Webservers ebenfalls verfügbar sein.

  Datentyp Eigenschaft
A_HRef DBTYPE_WSTR | DBTYPE_BYREF Text für HTML HREF. Dieser Eigenschaftsname wurde für Microsoft® Site Server erstellt und entspricht dem Eigenschaftsnamen HtmlHRef unter Index Server. Kann zwar abgefragt, aber nicht abgerufen werden.
Access VT_FILETIME Datum des letzten Zugriffs auf die Datei.
All(nicht anwendbar) Sucht nach jeder Eigenschaft für eine Zeichenfolge. Kann zwar abgefragt, aber nicht abgerufen werden.
AllocSizeDBTYPE_I8 Größe der Datenträgerzuweisung für eine Datei.
AttribDBTYPE_UI4 Dateieigenschaften. In Win32 SDK dokumentiert.
ClassIdDBTYPE_GUID Klassenbezeichnung eines Objekts, z. B. WordPerfect, Word usw.
CharacterizationDBTYPE_WSTR | DBTYPE_BYREF Charakterisierung oder Auszug des Dokuments. Wird von Index Server verarbeitet.
Contents(nicht anwendbar) Hauptinhalt der Datei. Kann zwar abgefragt, aber nicht abgerufen werden.
CreateVT_FILETIME Erstellungsdatum der Datei.
DirectoryDBTYPE_WSTR | DBTYPE_BYREF Physischer Pfad der Datei, ohne Dateinamen.
DocAppNameDBTYPE_WSTR | DBTYPE_BYREF Name der Anwendung, mit der die Datei erstellt wurde.
DocAuthorDBTYPE_WSTR | DBTYPE_BYREF Verfasser des Dokuments.
DocByteCountDBTYPE_14Anzahl von Byte im Dokument.
DocCategoryDBTYPE_STR | DBTYPE_BYREFDokumentart wie Memo, Zeitplan oder leeres Dokument.
DocCharCountDBTYPE_I4 Anzahl der Zeichen im Dokument.
DocCommentsDBTYPE_WSTR | DBTYPE_BYREF Kommentare über das Dokument.
DocCompanyDBTYPE_STR | DBTYPE_BYREFName des Unternehmens, für das das Dokument geschrieben wurde.
DocCreatedTmVT_FILETIME Datum, an dem das Dokument erstellt wurde.
DocEditTimeVT_FILETIME Zeit, die insgesamt zum Bearbeiten des Dokuments benötigt wurde.
DocHiddenCountDBTYPE_14Anzahl der verborgenen Folien in einem Microsoft® PowerPoint-Dokument.
DocKeywordsDBTYPE_WSTR | DBTYPE_BYREF Schlüsselwörter des Dokuments.
DocLastAuthorDBTYPE_WSTR | DBTYPE_BYREF Benutzer, der das Dokument zuletzt bearbeitet hat.
DocLastPrintedVT_FILETIME Zeitangabe, wann das Dokument zuletzt gedruckt wurde.
DocLastSavedTmVT_FILETIME Zeitangabe, wann das Dokument zuletzt gespeichert wurde.
DocLineCountDBTYPE_14Anzahl der Zeilen in einem Dokument.
DocManagerDBTYPE_STR | DBTYPE_BYREFName des Managers des Verfassers eines Dokuments.
DocNoteCountDBTYPE_14Anzahl der Seiten mit Anmerkungen in einem PowerPoint-Dokument.
DocPageCountDBTYPE_I4 Anzahl der Seiten im Dokument.
DocParaCountDBTYPE_14Anzahl der Absätze in einem Dokument.
DocPartTitlesDBTYPE_STR | DBTYPE_VECTORNamen von Teilen eines Dokuments. Bei Excel gelten beispielsweise die Namen von Arbeitsmappen als Titel von Teilen, bei PowerPoint sind dies Folientitel und bei Word für Windows die Namen der Dokumente im Zentraldokument.
DocPresentationTargetDBTYPE_STR|DBTYPE_BYREFZielformat (35 mm, Drucker, Video usw.) für eine Präsentation in PowerPoint.
DocRevNumberDBTYPE_WSTR | DBTYPE_BYREF Aktuelle Versionsnummer des Dokuments.
DocSlideCountDBTYPE_14Anzahl der Folien in einem PowerPoint-Dokument.
DocSubjectDBTYPE_WSTR | DBTYPE_BYREF Thema des Dokuments.
DocTemplateDBTYPE_WSTR | DBTYPE_BYREF Name der Vorlage für das Dokument.
DocTitleDBTYPE_WSTR | DBTYPE_BYREF Titel des Dokuments.
DocWordCountDBTYPE_I4 Anzahl der Wörter im Dokument.
FileIndexDBTYPE_I8 Eindeutige ID der Datei.
FileNameDBTYPE_WSTR | DBTYPE_BYREF Dateiname.
HitCountDBTYPE_I4 Anzahl der Treffer (Wörter, die mit der Abfrage übereinstimmen) in einer Datei.
HtmlHRefDBTYPE_WSTR | DBTYPE_BYREF Text aus HTML HREF. Kann zwar abgefragt, aber nicht abgerufen werden.
HtmlHeading1DBTYPE_WSTR | DBTYPE_BYREF Text aus HTML-Dokument im H1-Stil. Kann zwar abgefragt, aber nicht abgerufen werden.
HtmlHeading2DBTYPE_WSTR | DBTYPE_BYREF Text aus HTML-Dokument im H2-Stil. Kann zwar abgefragt, aber nicht abgerufen werden.
HtmlHeading3DBTYPE_WSTR | DBTYPE_BYREF Text aus HTML-Dokument im H3-Stil. Kann zwar abgefragt, aber nicht abgerufen werden.
HtmlHeading4DBTYPE_WSTR | DBTYPE_BYREF Text aus HTML-Dokument im H4-Stil. Kann zwar abgefragt, aber nicht abgerufen werden.
HtmlHeading5DBTYPE_WSTR | DBTYPE_BYREF Text aus HTML-Dokument im H5-Stil. Kann zwar abgefragt, aber nicht abgerufen werden.
HtmlHeading6DBTYPE_WSTR | DBTYPE_BYREF Text aus HTML-Dokument im H6-Stil. Kann zwar abgefragt, aber nicht abgerufen werden.
Img_Alt DBTYPE_WSTR | DBTYPE_BYREF Alternativer Text für <IMG>-Marken. Kann zwar abgefragt, aber nicht abgerufen werden.
PathDBTYPE_WSTR | DBTYPE_BYREF Vollständiger physischer Pfad der Datei, einschließlich Dateinamen.
RankDBTYPE_I4 Rang der Zeile. Reicht von 0 bis 1000. Je größer die Zahl, desto besser die Übereinstimmung.
RankVectorDBTYPE_I4 | DBTYPE_VECTOR Ränge der einzelnen Komponenten einer Vektorabfrage.
ShortFileNameDBTYPE_WSTR | DBTYPE_BYREF Kurzer (8.3) Dateiname.
SizeDBTYPE_I8 Dateigröße in Byte.
USNDBTYPE_I8 Aktualisierungssequenznummer. Nur bei NTFS-Laufwerken.
VPathDBTYPE_WSTR | DBTYPE_BYREF Vollständiger virtueller Pfad der Datei, einschließlich Dateinamen. Gibt es mehrere mögliche Pfade, wird die beste Übereinstimmung für diese Abfrage ausgewählt.
WorkIdDBTYPE_I4 Interne ID für die Datei. Wird von Index Server verwendet.
WriteVT_FILETIME Zeitangabe des letzten Schreibzugriffs auf eine Datei.

Definieren neuer Eigenschaftsnamen

Wenn Sie Eigenschaften definieren möchten, die nicht in der vorherigen Liste vorkommen, müssen Sie sie in einem [Names]-Abschnitt in der .idq-Datei speichern. Wenn Sie diese Eigenschaften in einer Einschränkung, Sortierfestlegung oder als abgerufene Spalte verwenden möchten, müssen Sie sie in der .idq-Datei definieren, indem Sie folgendes Format verwenden:

[Names]
#Eigenschaften, die sich nicht in der Standardliste
Eigenschaftsname ( Datentyp) = GUID ["Name" | propid]

In der Syntax steht "Name" für den Eigenschaftsnamen ("Verkauf" im nachfolgenden Beispiel), und propid steht für die in hexadezimalen Zahlen angegebene Eigenschafts-ID. Beachten Sie, dass Sie den Aliasnamen in Anführungszeichen setzen müssen, die Eigenschafts-ID jedoch ohne Anführungszeichen verwendet wird.

Sie möchten beispielsweise als Eigenschaftsnamen eine HTML-Metamarke definieren, die Beutzer als Suchkriterium verwenden können. Die zu definierende Eigenschaft ist Verkauf.

So definieren Sie die Eigenschaft Verkauf

  1. Fügen Sie in der .idq-Datei im Abschnitt [Names] folgende Zeile hinzu:
  2. MetaBeschreibung(DBTYPE_WSTR) = d1b5d3f0-c0b3-11cf-9a92-00a0c908dbf1 "Verkauf"

    Die Angabe für den GUID wird über den Registrierungsparameter MetaTagClsid festgelegt, der sich unter folgendem Pfad befindet:

    HKEY_LOCAL_MACHINE
    \SYSTEM
     \CurrentControlSet
      \Control
       \HtmlFilter
        \MetaTagClsid
  3. Legen Sie anschließend die Meta-Beschreibung für die HTML-Dateien fest, in denen die Marke enthalten sein soll.
  4. Geben Sie zum Beispiel an, dass Sie alle Dateien mit Verkaufsprognosen suchen möchten:

    In Datei1.htm:

    <META NAME="Verkauf" CONTENT="Prognosen für 1998">

    In Datei2.htm:

    <META NAME=" Verkauf" CONTENT=" Prognosen für 1999">

    In Datei3.htm:

    <META NAME="Verkauf" CONTENT="Vekauf für 1997">

Anmerkung   Stellen Sie sicher, dass die META NAME-Marken zwischen die HTML-Marken <head> und </head> am Anfang der Datei gesetzt werden.

Sie können auch nach allen Dateien suchen, die Verkaufsprognosen enthalten. Geben Sie folgende Abfrage aus:

@metabeschreibung prognosen

Diese Abfrage gibt alle Dateien zurück, in denen im CONTENT-Feld das Wort Prognosen enthalten ist. In diesem Beispiel werden somit Datei1.htm und .htm zurückgegeben.

Wenn Sie jedoch nach Verkäufen pro Jahr suchen möchten, um zum Beispiel eine Liste mit den Verkäufen im Jahr 1997 zu erhalten, geben Sie folgende Abfrage aus:

@metabeschreibung 1997

Die Datei 3.htm wird zurückgegeben.

 

ZURÜCK ZU SUCHEN