25
1 © disclosure or duplication without consent prohibited COMET K2 Competence Center - Initiated by the Federal Ministry of Transport, Innovation & Technology (BMVIT) and the Federal Ministry of Economics & Labour (BMWFI). Funded by FFG, Land Steiermark and Steirische Wirtschaftsförderung (SFG) Enterprise Search: Potenziale und Fallstricke 3. Kremser Wissensmanagement-Tage Donau-Universität Krems Dr. Alexander Stocker

Enterprise Search: Potenziale und Fallstricke

Embed Size (px)

DESCRIPTION

issensarbeitende von heute wünschen sich die Einfachheit und Nützlichkeit der "Google-Suche" auch hinter der Firewall. Die Erwartungen der Anwender an das sog. Enterprise Search sind daher sehr hoch. Doch Internet-Suche und Intranet-Suche zeichnen sich durch zahlreiche konzeptionelle Unterschiede aus, welche in diesem Vortrag weiter ausgeführt werden. Um diesen Aspekt weiter zu vertiefen, stellt dieser Vortrag die Ergebnisse einer nutzernahen Evaluierung von Enterprise Search vor und diskutiert dessen Potenziale und Fallstricke

Citation preview

Page 1: Enterprise Search: Potenziale und Fallstricke

1© disclosure or duplication without consent

prohibited

COMET K2 Competence Center - Initiated by the Federal Ministry of Transport, Innovation & Technology (BMVIT) and theFederal Ministry of Economics & Labour (BMWFI). Funded by FFG, Land Steiermark and Steirische Wirtschaftsförderung (SFG)

Enterprise Search: Potenziale und Fallstricke

3. Kremser Wissensmanagement-TageDonau-Universität Krems

Dr. Alexander Stocker

Page 2: Enterprise Search: Potenziale und Fallstricke

2© disclosure or duplication without consent

prohibited

Einführung Nutzerzufriedenheit Enterprise Search vs. Internet-Suche Ergebnisse einer Nutzerevaluierung

Enterprise SearchAgenda

Page 3: Enterprise Search: Potenziale und Fallstricke

3© disclosure or duplication without consent

prohibited

Enterprise SearchEinführung

Page 4: Enterprise Search: Potenziale und Fallstricke

4© disclosure or duplication without consent

prohibited

Nutzung unterschiedlicher IT-Systeme: Wissensinseln statt einheitlicher unternehmensweiten Wissensbasis

Mitarbeitern fehlt der Überblick über die Gesamtheit der Repositories: Einzelner MA weiß nicht, wie/wo er seinen Informationsbedarf decken kann.

Mitarbeiter können benötigte Informationen nicht finden: Produktivität leidet darunter. Entscheidungen werden auf falschen Informationen gebildet: Resultat sind schlechte

Entscheidungen. Problem wird erneut bearbeitet, obwohl an anderer Stelle schon gelöst: Das Rad wird

ein zweites Mal erfunden Hohe Erwartungen der Anwender an Suche im Unternehmen:

„Google“ im Unternehmen

Enterprise SearchBedarf

Page 5: Enterprise Search: Potenziale und Fallstricke

5© disclosure or duplication without consent

prohibited

Enterprise SearchBedarf

Findability Survey 2013 http://de.slideshare.net/findwise/enterprise-search-and-findability-survey-2013

Page 6: Enterprise Search: Potenziale und Fallstricke

6© disclosure or duplication without consent

prohibited

Enterprise Search schließt jegliche Organisation mit Textinhalten in elektronischer Form ein und umfasst die Suche auf externen Unternehmenswebseiten, auf internen Unternehmenswebseiten (d.h. dem Unternehmensintranet), sowie die Suche nach Text in E-Mails, Datenbankeinträgen, in Dokumenten auf

Fileshares und Ähnlichem.(„Challenges in Enterprise Search“, Hawking, 2004)

Enterprise SearchDefinition

Page 7: Enterprise Search: Potenziale und Fallstricke

7© disclosure or duplication without consent

prohibited

Enterprise Search Architektur (simplifiziert)

Benutzerschnittstelle

Inhaltsquellen

Suchindex

In welcher Inhaltsquelle steht welcher Inhalt wie oft und an welcher Stelle?

Suchanfrage TrefferlisteFiltermöglichkeit durch Facetten

Konnektoren

Für die Suche aufbereiteter Volltext der Inhalte aus den Inhaltsquellen

Fileshare N: Wiki:

Page 8: Enterprise Search: Potenziale und Fallstricke

8© disclosure or duplication without consent

prohibited

Enterprise SearchFunktionsweise (simplifiziert)

Suchindex

Word-Dokument

• Extrahieren des Inhalts (formatfreier Volltext)• Entfernung von Leerzeichen & Interpunktion (Worte =

Tokens)• Entfernen der Stoppworte (inhaltsbereinigte Tokens) • Zurückführung von Wörtern in Grundform (Autos = Auto)• Tokens als Basis für inversen Index

(Liste von „Wörtern“ und den Dokumenten, in welchen diese vorkommen)

• ..

Konnektor für Word

Page 9: Enterprise Search: Potenziale und Fallstricke

9© disclosure or duplication without consent

prohibited

Enterprise SearchFunktionsweise (simplifiziert)

Suchindex

• Extrahieren des Inhalts• Zerlegung in Worte• Entfernen der Stoppworte• Zurückführung von Wörtern in Grundform• …

Benutzerschnittstelle• Titel• Textschnipsel• Ort (Quelle)• Metadaten• ..

• Nach Relevanz sortiert

Page 10: Enterprise Search: Potenziale und Fallstricke

10© disclosure or duplication without consent

prohibited

Enterprise Search(z.B. Microsoft Sharepoint Foundation 2013)

Page 11: Enterprise Search: Potenziale und Fallstricke

11© disclosure or duplication without consent

prohibited

Enterprise SearchZufriedenheit

Page 12: Enterprise Search: Potenziale und Fallstricke

12© disclosure or duplication without consent

prohibited

Enterprise SearchZufriedenheit

Findability Survey 2013 http://de.slideshare.net/findwise/enterprise-search-and-findability-survey-2013

Page 13: Enterprise Search: Potenziale und Fallstricke

13© disclosure or duplication without consent

prohibited

Enterprise SearchZufriedenheit

Mindmetre: Report „Minding the Search Gap“

Page 14: Enterprise Search: Potenziale und Fallstricke

14© disclosure or duplication without consent

prohibited

Enterprise SearchZufriedenheit

Findability Survey 2013 http://de.slideshare.net/findwise/enterprise-search-and-findability-survey-2013

Page 15: Enterprise Search: Potenziale und Fallstricke

15© disclosure or duplication without consent

prohibited

Internet Suche Suchraum besteht aus verlinkten Web-

Seiten und einfach zu erschließenden Dokumenten in Standardformaten

Internet-Suchmaschinen wie Google bewerten die Relevanz von Webseiten anhand der auf sie zeigenden Hyperlinks

Informationen auf Web-Seiten, „wollen“ idR gefunden werden und werden daher speziell für Suchmaschinen optimiert

Internet-Suche durchsucht den „öffentlichen“ Teil des Intranets, Zugriffsrechte sind dort irrelevant.

Internet-Suchanfragen sind oft viel „allgemeinerer Natur“. Der Suchende ist in vielen Fällen mit einer „guten“ Antwort (von vielen möglichen guten Antworten) zufrieden, wobei meist viele mögliche gute Lösungen existieren.

Internet-Suche vs. Enterprise Search

Intranet Suche (Enterprise Search)

Inhalte sind sehr heterogen, von völllig unstrukturiert bis hin zu strukturierten Inhalten in Datenbanken

Inhalte sind in Unternehmen in der Regel nicht verlinkt, es bedarf anderer Ansätze zur Relevanzbewertung

Anwender ergreifen idR wenig Initiative, um Inhalte für Intranet-Suchmaschinen zu optimieren (z.B. durch systematische Metadatenpflege)

Komplexe Rollen- und Rechtestrukturen machen die Sicherstellung von Zugriffsbeschränkungen essentiell

Bei der Internet-Suche existiert oftmals nur ein einziges richtiges Dokument (d.h. genau das richtige), das der Mitarbeiter möglichst rasch finden werden will.

Page 16: Enterprise Search: Potenziale und Fallstricke

16© disclosure or duplication without consent

prohibited

Nutzernahe Evaluierung von Enterprise Search

Page 17: Enterprise Search: Potenziale und Fallstricke

17© disclosure or duplication without consent

prohibited

Aufgabenstellung Forschungseinrichtung im Umfeld Automotive Engineering mit rund 200

Wissensarbeitenden Pilot einer Enterprise Search für die Suche nach projektspezifische Inhalten auf

einem Fileshare (mit Microsoft Sharepoint Foundation 2013 Identifikation nutzernaher Aspekte zu Enterprise Search durch 10 an Experimenten

teilnehmenden Wissensarbeitende Ablauf der Evaluierung

Kurzes semi-strukturiertes Interview (Tätigkeiten, Dokumente & Tools, Infobedarf, Suchraum- und Dauer)

Festlegung möglicher Suchtasks und Exploration durch den Wissensarbeitenden im Rahmen von „Thinking-Aloud“

Transkription der Interviews und Inhaltsanalyse Zusammenfassung der wesentlicher Aussagen und Erkenntnisse

Nutzernahe Evaluierung von Enterprise Search

Page 18: Enterprise Search: Potenziale und Fallstricke

18© disclosure or duplication without consent

prohibited

Das Finden geeigneter Keywords die zum gewünschten Suchergebnis führen sollen ist elementar – und äußerst schwierig Je „besser“ die verwendeten Keywords, desto relevanter das Suchergebnis Wissen über den möglichen Inhalt eines gesuchten Dokuments spiegelt sich in mehr

oder weniger geschickt gewählten Keywords wider (z.B.: Projektnamen, -kurznamen, -kürzel)

Normen, Strukturen und Schreibweisen bei Dokumentennamen und –inhalt relevant (zB immer Projektkürzel ohne - ): Je besser gelebt, desto besser das Suchergebnis.

Ergebnisse der Evaluierung (1)

„Also das Projekt heißt AS4T06, ach, wobei ich jetzt nicht weiß mit Bindestrich, Unterstrich oder zusammen. Also würde ich das jetzt einfach mit

dem Leerzeichen eingeben AS4 T06 ..“

“Wobei das Dokument glaube ich heißt anders… Du musst irgendwie das Vokabular, das sich entwickelt hat kennen, damit du eigentlich die Möglichkeit hast danach zu suchen ... Also die

richtigen Keywords zu finden, ist echt eine Herausforderung. “

“Bei der Suche ist halt der Haken, dass man schon relativ viel wissen

muss. Daher ist mir oft eine saubere Ordnerstruktur

sympathischer, wo ich mich durchklicken kann.“

Page 19: Enterprise Search: Potenziale und Fallstricke

19© disclosure or duplication without consent

prohibited

Die Nutzung von Metadaten für die Suche wird durch die in der Praxis oft ungepflegten Metadaten in Dokumenten erschwert Metadaten werden für die Suche verwendet und dienen der Filterung (sog. „Facetten“) Fehlende oder falsche Metadaten reduzieren die Suchqualität

(z.B. angezeigter Autor ist nicht der echte Autor, sondern nur der Ersteller der Vorlage) Systematische Pflege der Metadaten aus Sicht der Wissensarbeiternden ohne

Zusatznutzen, wenn keine Suchmaschine vorhanden

Ergebnisse der Evaluierung (2)

“Autor,.. OK, ..das liest er also aus. Problem ist, dass es so in

der Vorlage steht, und es keiner ändert.“

“Ich frage mich, ob da immer ... aha das ist der Titel vom Powerpoint ... Folie 1…, was zeigt er mir da eigentlich immer an? Wieso

kommt da immer Folie 1, und nicht zum Beispiel der Titel der Präsentation.“

“Ja da stehen irgendwelche Sachen bei uns drinnen… Wachmann ... Aber ja da steht

irgendetwas drinnen. Das ist ja alles überhaupt nicht gepflegt bei uns. Weil es

auch keiner gebraucht hat bis jetzt“

Page 20: Enterprise Search: Potenziale und Fallstricke

20© disclosure or duplication without consent

prohibited

“Genau! Und jetzt findet er mit Projektmeeting und Stuttgart nichts, dann sage ich, OK ich suche nur nach Projektmeeting ... Stuttgart ist jedoch so ein

essentieller Inhalt der drinnen sein muss, weil sonst kann er damit gar nichts anfangen.“

“Wir haben zwar eine Namenskonvention für Dokumente,

aber ... Einer verwendet einmal einen Bindestrich, einer einen Unterstrich.

Dann sind doch immer wieder Leerzeichen drinnen. Aber ich glaube das ist generell ein Suchproblem. Eh bei allen Maschinen ... Weil auf die

Idee wäre ich jetzt zum Beispiel nicht gekommen, dass ich AreaD einmal

trenne.“

„Also mit ..[mom].. vorher habe ich das Aktuellste gefunden. Aber da hat er eben

nachgeschaut im Content und da war eben oben im Aktuellsten eben ..[mom].. drinnen

und im Alten nur ..[minutes of meeting]. Deswegen hat er es anders nicht gefunden ...“

Einheitliche Dokumenteninhalte und inbs. Schreibweisen erhöhen die Qualität der Suche, sind aber leider nicht immer vorhanden Essentielle Wörter und Informationen im Dokument erhöhen Suchererfolg

(z.B. Autor, Ort, Datum, einheitliche Projektbezeichnung, einheitl. Dokumententyp, ...) Struktur und Norm essentieller Information in Dokumenten muss gelebt werden, um

„Raterei“ zu vermeiden („welches Schlagwort könnte denn im Dokument stehen?“)

Ergebnisse der Evaluierung (3)

Page 21: Enterprise Search: Potenziale und Fallstricke

21© disclosure or duplication without consent

prohibited

Die Relevanzbewertung der Suchergebnisse durch die Suchmaschine entspricht nicht immer den Wünschen der Nutzer Die Häufigkeit des Vorkommens der Keywords in den indizierten Dokumenten ist

primär verantwortlich für die Reihung der Dokumente in der Trefferliste Die Reihung der Treffer ist elementar für Nutzerzufriedenheit; Reihung nach

„Aktualität“ wurde gefordert Workaround: Kopie des Pfades zum gesuchten Dokument aus der Trefferliste &

manuelle Navigation durch die Ordnerstruktur

Ergebnisse der Evaluierung (4)

“Das ist die Aktuellste… Das Einzige, was mich da jetzt wundert ist, dass die

Aktuellste da eigentlich am Schluss liegt.“

“Die Leute wünschen sich das gesuchte Dokument sehr weit vorne, und ich glaube die Leute haben auch nicht die Akzeptanz, dass sie da ewig blättern in der Trefferliste.“

Page 22: Enterprise Search: Potenziale und Fallstricke

22© disclosure or duplication without consent

prohibited

Enterprise Search muss sich gegen bestehende „Suchstrategien“ (bzw. Informationsbeschaffungsstrategien) behaupten Face2Face Gespräche sind für die Infosuche von größter Bedeutung

(z.B.: Ablageort eines Dokuments wird erfragt) Benutzer haben die Struktur der Projektordner „verinnerlicht“, so dass sie nicht mehr

suchen, sondern gezielt navigieren (d.h. „finden“) Nutzung von Verknüpfungen auf Ordner und Dokumente

(Links zu Projekten und wichtigen Dokumenten über Instant Messenger)

Ergebnisse der Evaluierung (5)

„Ich bin da nämlich ein bisschen ein Verfechter, dass die Ordnerstruktur wirklich sauber sein sollte. Suchmaschine ist dann

auch gut, wenn es sie gibt, aber nicht stattdessen!“

“Das hat so oft den Namen geändert in letzter Zeit, dass ich jetzt eigentlich gar

nicht mehr weiß wie es heißt. An meinem Rechner habe ich einfach einen Link

darauf, und damit ist die Sache erledigt ...“

Jetzt bin ich nämlich selber neugierig, ... Was ich jetzt schon merke, was für mich total ungewohnt ist … ich bin

gewöhnt, dass ich mich durch die Ordnerstrukturen durcharbeite. Aber ich nehme jetzt die Ordnernamen

nicht mehr so wahr.

Page 23: Enterprise Search: Potenziale und Fallstricke

23© disclosure or duplication without consent

prohibited

„Ja, hat mir eigentlich ganz gut gefallen jetzt. Also ich glaub schon, dass das

helfen könnte. Mir haben jetzt ein bisschen die konkreten Anlassfälle dafür gefehlt.“

Enterprise Search muss aus Sicht der beteiligten Wissensarbeiter rasch einen Mehrwert für die tägliche Arbeit darstellen. Verwendung ungewohnt, obwohl Google-Suche täglich praktiziert Enterprise Search nimmt mehr Zeit in Anspruch, als Navigation durch Ordnerstruktur Probleme bei Office-Dokumenten aufgrund großer Anzahl verschiedener

Dokumentenversionen (generell hohe Anzahl „ähnlicher“ Office-Dokumente) Tlw. Unzufriedenheit mit Suche, da Keywords nicht immer im Dokument vorhanden,

bzw. in anderer Schreibweise

Ergebnisse der Evaluierung (6)

“Also normal, in der Ordnerstruktur wäre ich halt her gegangen und hätte unterhalb irgendwo gesehen ... Wenn ich da reingegangen wäre. Das habe ich halt in einer Suche zum Beispiel

dann nicht unbedingt... Ich denke mir bei solchen Fällen sind hierarchische

Strukturen leichter. Weil ich mich Schritt für Schritt vorhantle.“

“Ja ich glaube schon, man muss am Anfang ein bisschen umdenken, dass man nicht einfach in den

Ordnern sucht, …. war vielleicht nicht so schlecht, die Schätzung mit den

10 Minuten Zeitersparnis.“

“Also ich glaube, dass ich mit der Suche länger brauche, als so normal,

bis ich es finde.“

Page 24: Enterprise Search: Potenziale und Fallstricke

24© disclosure or duplication without consent

prohibited

1. Enterprise Search Einführung

2. Enterprise Search Nutzerzufriedenheit

3. Enterprise Search Potentiale & Fallstricke

Enterprise SearchZusammenfassung

Page 25: Enterprise Search: Potenziale und Fallstricke

25© disclosure or duplication without consent

prohibited

Kontakt

Dr. Alexander Stocker

VIRTUAL VEHICLE

[email protected]