1. Schnelleinstieg: Einen Index erstellen

  1. Öffnen Sie den IndexMakerS.
  2. Auswählen der Dokumente, die indiziert werden sollen: Klicken Sie auf das + Symbol in der "Index erstellen"-Palette (oder cmd-N) und wählen Sie das oder die PDFs aus, die indiziert werden sollen.
  3. Klicken Sie auf "Index erstellen".
  4. Bearbeiten Sie dien Rohindex mit Hilfe von Stoppwortlisten, Substitutionen und aneren Filtern oder wählen Sie nur bestimmte Zielwörter aus.
  5. Das Ergebnis formatieren
    In der Vorschau-Ansicht können Sie Ihren Index für die PDF-, Print-, HTML- oder XML-Ausgabe formatieren und über das Datei-Menü exportieren.

2. Index erstellen

2.1. Index erstellen - Palette

Um ein PDF Dokument auszuwählen, das indiziert werden soll, klicken Sie auf das "+" Symbol. Sie können dabei auch ein Verzeichnis auswählen. Dann werden alle PDF Dokumente innerhalb des Verzeichnisses geladen.
Um ein Dokument wieder zu löschen wählen sie es aus und klicken Sie auf das "-" Symbol.
Die Reihenfolge der Dokumente können Sie per Drag&Drop ändern.
Für jedes Quelldokument lässt sich festlegen von welcher bzw. bis welcher Seite die Indizierung passieren soll. Tragen Sie die Angaben in die Spalten "Von" und "Bis" ein. Lasen Sie die Felder leer, wird das gesamte Dokument indiziert.
Klicken Sie doppelt auf den Dateinamen eines Quelldokuments, um eine Vorschau des Dokumentes zu sehen.

Seitenzählung
Um die Seitenzahlen richtig zuordnen zu können ist es wichtig, dass der IndexMaker weiss, auf welcher physischen Seite die Seite mit der Nummer 1 ist.
Beginnt das erste Dokument mit Seite 1 oder einer höheren Seitenzahl, tragen Sie diese in das Textfeld ein und wählen Sie die erste Option.
Beginnt die Seitenzählung erst auf einer späteren Seite mit der Seitenzählung 1, wählen Sie die zweite Option und tragen Sie die Seite der PDFs ein, auf der die Seitenzählung beginnt. Alle Seiten davor, werden mit römischen Ziffern indiziert.

Wenn Sie mehrere Dokumente gleichzeitig indizieren, können Sie angeben, dass die Nummerierung fortlaufend sein soll. Sonst beginnt sie bei jedem Dokument wieder mit der Seitenzahl 1.

2.1.1. Physische und inhaltliche Seitenzählung

2.2. Voreinstellungen

Diese Einstellungen müssen Sie vornehmen, bevor Sie den Index erzeugen!

2.2.1. Voreinstellungen für das Indexieren

Legen Sie fest, welches die zugelassenen Zeichen beim Indizieren sein sollen und welche Zeichen als Worttrenner dienen sollen. In der Regel reichen die Grundeinstellungen aus und müssen nicht verändert werden.
Sie können aber bei Bedarf zusätzliche Zeichen hinzufügen. Wenn auch griechische, hebräische oder kyrillische Schriftzeichen oder Katakana oder Sanskrit erkannt werden sollen, können Sie sie durch das Setzen des Häkchens zu den zugelassenen Zeichen hinzufügen.

Sie können bestimmen, dass E-Mail Adressen beim Indizieren nicht getrennt werden sollen, obwohl sie Worttrenner-Zeichen (@ und Punkt) beinhalten. Dies können Sie ebenso für Preisangaben (11,99) oder Uhrzeiten (14:45) festlegen.
Oder Sie formulieren mittels Regular Expressions eine eigene Bedingung.

2.2.2. Beachten von Groß- und Kleinschreibung

Sie können bestimmen ob HTLM codierte Zeichen in UTF-8 umgesetzt und Tags ausgefiltert werden sollen. Dazu wählen sie die Checkbox "HTML dekodieren" an.
Die Indizierung beachtet grundsätzlich Groß- und Kleinschreibung.
Sie können festlegen, ob beim Vergleich Ihrer Ziel- und Stopworte mit dem Text der Quelldokumente Gross- und Kleinschreibung beachtet werden soll oder nicht.

2.2.3. Referenztext

Wenn Sie einen Begriff hierarchisch unter einen anderen stellen, steht er im Index nicht mehr an seiner ursprünglichen Stelle sondern nur noch unterhalb des hierarchischen Oberbegriffs. Sie können aber einen Querverweis an seiner ursprünglichen Stelle, wie z.B. "siehe: ..." anbringen. Tragen Sie im Referenztext Textfeld den Text ein, mit dem Ihre Verweise beginnen sollen.

2.2.4. Edit-Tabelle

Wenn Sie die Rechtschreibkorrektur einschalten werden Begriffe die unbekannt sind im Bearbeiten Modus markiert. Das ist manchmal hilfreich um etzte Fehler zu korrigieren.
Sie können die Schriftgröße der Edit-Tabelle hier festlegen.

3. Index Bearbeiten

3.1. Indextabelle

Spalte 1: Spalte 2: Spalte 3:

3.2. Index filtern

Sie haben verschiedene Möglichkeiten bestimmte Worte aus dem Index auszuschließen oder umzuwandeln.

3.2.1. Zielwörter

Statt den Volltextindex schrittweise zu reduzieren und zu filtern können sie alternativ auch Zielworte definieren, also eine positive Auswahl an Wörtern festlegen, welche im Index erscheinen sollen.
Zielworte werden im Listen Editor in der Zielwortliste gesammelt und erscheinen in der Indexliste in grün.

Um ein Wort als Zielwort zu bestimmen haben Sie folgende Möglichkeiten:

Bei den letzten beiden Möglichkeiten wird das Wort automatisch der Zielwortliste hinzugefügt. Ebenfalls werden alle seine Substitutionen - sofern es welche gibt - in die Zielwortliste eingetragen. In der Filterpalette sehen Sie die aktuelle Anzahl der Zielworte.

Wenn Sie in der Filter-Palette bei den Zielworten "andere verbergen" anwählen, werden nur die Einträge gezeigt, die als Zielworte definiert und im PDF gefunden wurden.
Wurden noch keine Zielworte definiert oder wurde keines der Zielworte im Index gefunden, ist der Index leer.

Sie können hier Namen von Personen in zweierlei Form angeben: Als "Max Mustermann" oder als "Mustermann, Max". Entsprechend erscheint der Eintrag im Index. Wenn Sie "Mustermann, Max" angeben, wird auch nach "Max Mustermann" im Text gesucht.

3.2.2. Stoppwörter

Stoppwörter sind Wörter die so bedeutungsschwach sind, das sie nicht im Index erscheinen sollen, wie: "in, an, mit, und, der, die, daß,..." etc. Sie werden in der Indexliste grau dargestellt und in der Vorschau bzw. beim Export nicht berücksichtigt.

Um ein Wort als Stoppwort zu bestimmen haben Sie folgende Möglichkeiten:

Das Wort wird dann automatisch der Stoppwortliste hinzugefügt. Ebenfalls werden alle seine Substitutionen - sofern es welche gibt - in die Stoppwortliste eingetragen.

In der Filterpalette sehen Sie die aktuelle Anzahl der Stoppwörter. Sie können die Anzeige von Stoppwörtern verhindern, indem Sie in der Filter Palette das entsprechende Häkchen setzen.

3.2.3. Substitutionen

Mit der Substitutionsliste werden Wörter durch ein anderes Wort ersetzt. Das ist dann sinnvoll, wenn Wörter z.B. auf ihre Grundform zurückgeführt werden sollen (z.B. Baumes -> Baum). Diese Wörter werden in der Indexliste grau dargestellt, da ihre Adressen in der Vorschau bzw. beim Export ihrer Grundformen zugeschlagen werden.
Substitutionen werden automatisch auch zu Zielworten.

Um einem Wort eine Grundform zuzuweisen haben Sie folgende Möglichkeiten:

Das Wort wird dann automatisch der Substitutionsliste hinzugefügt. In der Filterpalette sehen Sie die aktuelle Anzahl der Substitutionen.

3.2.4. Hierarchie

Mit dieser Liste können Sie Begriffe unter einem Oberbegriff zusammenfassen. Wenn z.B. die Begriffe Eiche, Buche, Ahorn etc. unter dem Oberbegriff Baum erscheinen sollen. Im Index werden die Unterbegriffe folgendermassen angezeigt: Eiche (-> Baum) Die Hierarchie kann mehrere Ebenen enthalten. Um Zrikelbezüge zu vermeiden, können Unterbegriffe nicht ihre eigenen Oberbegriffe sein.

Um ein Wort zu einem hierarchischen Unterpunkt von einem anderen zu machen haben Sie folgende Möglichkeiten:

Das Wort wird dann automatisch der Hierarchieliste hinzugefügt. In der Filterpalette sehen Sie die aktuelle Anzahl der Hierarchien.

3.2.5. Weitere Filter

3.2.6. Schriftarten Filter

Mit dem Schriftarten Filter können Wörter, die in einer bestimmten Schriftart/-größe im Dokument vorkommen, aus dem Index entfernt werden. Es werden alle im Dokument vorkommenden Schriften aufgelistet. Um Wörter einer bestimmten Schrift aus dem Index zu entfernen, muss die entsprechende Checkbox deaktiviert werden.
Das kann hilfreich sein, um zum Beispiel Überschriften oder Fußnoten auszuschließen. Voraussetzung dafür ist, dass diese in einer abgrenzbaren Schriftart vorliegen.
Diese Funktion ist nutzbar mit Indexen die ab Version 5.1 erstellt wurden.

3.2.7. Fundstellenformat

Der Rohindex enthält zunächst redundante Adressen (Angaben der Fundstellen). Sie können die Formatierung der Adressangabe bestimmen. Dazu stehen Ihnen fünf Formate zur Auswahl.
Wenn Sie mehrere Dokumente gleichzeitig indizieren, können Sie sich die Dateinamen in den Adressen anzeigen lassen.

3.2.8. Rechtschreibkorrektur

Wenn Sie in der Filter-Palette das Häckchen bei "Nur fehlgeschlagene Rechtschreibprüfung" setzen, wenden Ihnen nur die Wörter angezeigt, bei denen die Rechtschreibkorrektur fehlschlug. Diese Funktion eignet sich gut zur Korrektur eventueller Rechtschreibfehler.
In den Voreinstellungen können Sie die Rechtschreibkorrektur deaktivieren.

3.2.9. Zahlenfilter

Wenn Sie in der Filter-Palette (siehe 3.2.0) "keine Zahlen indizieren" anwählen, können Sie Einträge, die Zahlen enthalten, ausschließen. Mit dem Zahnradsymbol können Sie definieren: