Über Suchen, Finden und Metadaten

Moin,

Vielen dank für das Metadokument (verbesserte Version)
Ich habe mittlerweile Kontakt mit den Programierern hergestellt und bekomme jetzt vollen Zugang zum Queltext im Internet. Schaun wir mal.

An der Geschichte mit der Volltextindizierung bin ich wahrscheinlich nicht ganz unschuldig. Ich versuche “Neulinge” immer davon zu überzeugen, daß das hochladen von relevanten Informationen wichtig ist. Der gemeine Mitarbeiter würde nähmlich am liebsten alles was er so zusammensammelt (wie eine Elster) in ein Verzeichnis werfen und schwupp im Portal haben.

Damit haben können wir die Dokumente einerseits nicht mit Metadaten bedampfen, andererseits erfasst die systemeigene Volltextsuche die Objekte nicht, da Sie halt nicht in im System sind.

Da man, wie sie wissen, die Erfassung von Meta Daten schlecht verkaufen kann, hebe ich bei entsprechenden Vorträgen meist auf die integrierte Volltextindizierung der eingestellten Dokumente ab.

Mea Culpa.

Den Meisten hilft aber auch daß nicht viel, da eine simple Suche nach ncw (network centric warfare) eben nicht nur die PPT Präsentation bringt, die der Abteilungsleiter gestern hat einstellen lassen, sondern auch die 2 Mio. anderen Objekte, die irgendwie damit zu tun haben. Ergo… auch Suchen will gelernt sein.

Mit dem Suchobjekt hat es folgendes auf sich:

Die Suche durchsucht lediglich die Metadaten der Objekte.
In der Advanced Search kann man optionen für jedes der Meta-Felder mit Werten zur Suche bestücken, um ein entsprechend eingeschränktes Ergebnis zu erhalten.
Da ich mittlerweile auch herausdokumentiert habe, wie man so eine Suche mit voreingestellten Werten in eine URL schreiben kann, ist es auch möglich, vordefinierte Suchen zu scripten, die dann beispielsweise virtuelle Verzeichnisse abbilden.

Beispiel:

zeige mir alle Objekte mit dem Mime-Types application/pdf, application/office-word …. usw.
die im Titel den Begriff INMGS haben und
bei denen das Modifikationsdatum heute ist,

ergibt eine Liste aller, über die Site verteilter Eingangssprüche, die heute in das System gestellt wurden.

Organisatiorische vorraussetzung. Das Kriterium INMSG findet sich in jedem Titel wieder…. aber daß kann man ja bei uns befehlen…;-)

Um eine Erfassung des Volltextes zu ermöglichen, hat man den Contentbereich virtuell zu einem Meta-Datum gemacht, sodaß das jeweilige Dokument voll verschlagwortet wird….

Soweit so gut…

Das ganze hat natürlich, abgesehen von dem Erfordernis sich mit der Philosophie der Suche beschäftigen zu müssen, ein paar Haken.

Über den mit der Anzahl der Ergebnisse hab ich ja schon ausgeführt.
Desweiteren beschränkt sich die Suche bislang auf die jeweilige SITE. Da wir, in unserer Firma zumindest, unser Portal aus Performanz- und Administrationsgründen in viele kleine Sites (jedes Thema ist in sich autark) geteilt haben, taugt die WISE Suche nur für den jeweilgen Informationsabschnitt (SITE).
Es gibt mehrere Ansätze diesen Nachteil zu umgehen.

  • Man kann z.B. die Instanz (www.mein webserver.de) bei der filialübergreifenden Suchmaschine Bw anmelden. Die indiziert dann selbst 3 mal die Woche in der verkehrsarmen Zeit.
    Das kann aber auch viele ungewollte Besucher ziehen. Wir hatten mal das Problem, daß die halbe Welt über einen Link auf unserer Geschäftsreiseseite auf den Routenplaner zugegriffen hat, weil wir in der Suchmaschine so hohe Rankings hatten…… 1,4 Mio hits pro Tag, davon 60 % über Einträge aus der Suche.
    Wir haben den Index dann löschen lassen….;-)
  • Man kann selbst eine Suchmaschine aufsetzen.
    Wir haben das jetzt gemacht und indizieren alle unsere SITES selbst über die Filialsuchmaschine…
    Allerdings ist das Ergebnis bewußt flach gehalten und soll den Nutzer nur auf eine Seite bringen, die mit seinem Begriff zu tun hat…
    Das reicht in 80% der Fälle, die den Begriff Recherche sowieso nur mit Hilfe des Duden erfassen……

Aussichten:

Die Version 1.3 des WISE wird zur Zeit Alpha getestet. Bezüglich der Metadaten- /Suche gibt es hier folgende Verbesserungen:

  • Metadatenfelder können über eine XML Datei vorausgefüllt werden. Wir haben ja schon über die Voreinstellungen gesprochen und ich arbeite daran, die festeingestellten Vorgaben nach Ihren Vorgaben zu modifizieren.
    Das XML Modell ermöglicht es uns, einen Schlagwortkatalog zu entwickeln und auch relativ leicht einzubauen.
  • Metainformationen / Tags werden in den Header (<head>…..</head>der jeweiligen Seite eingebaut und sind damit von externen Suchmaschinen besser zu finden.
    Wir hatten das vorgeschlagen, NATO hat das aufgenommen, weil die für Ihre SITES ein sog. Google Appliance eingekauft haben, eine Blackbox mit der Intelligenz von Google eingebaut. Kostet ca. 3000 Euro pro 50.000 Dokumente.
  • Die WISE interne Suche wird SITE übergreifend arbeiten. Damit fällt das Erfordernis für administrativ aufwändige externe Suchmaschinen weg.

Also wird alles besser.

Die Volltextindizierung entbindet meines Erachtens nicht von einer Pflege der Metadaten, da der Index und damit auch der Ergebnispool viel zu umfangreich wird.

Die simple Vergabe eines Aktenzeichens würde uns schon weiterhelfen. Ich glaube auch daß das ein vielversprechender Ansatz ist.

  • AZ sind eingeführt und
  • der Aktenplan ist firmenweit einheitlich..
    Er ist nur einfach schlecht handhabbar für den Nutzer.

Wir müssen in der Organisation erstmal dazu kommen, daß jeder Mitarbeiter weiß, für welche Aktenzeichen er verantwortlich ist.

  • Schritt1:
    unser Wissensmanager muss die Abteilungen mit einer vorbereiteten Abfrage / Liste dazu bringen die Verantwortlichkeiten festzulegen.
  • Schritt 2:
    Anhand dieser Liste kann dann jeder Mitarbeiter seinen eingestellten Dokumenten schon mal eine Document Reference Number geben.
  • Schritt 3:
    Mit einer vorbereiteten Suche für jeden Fachbereich können die relevanten Dokumente aus dem Netz gefischt werden

Ich mache mir dann einen Kopf wie man in den Übersichten das Metafeld mit einbauen kann.

This entry was posted in Allgemein, Metadaten, Suchen. Bookmark the permalink.

Leave a Reply