Zusammenfassung
Im klassischen Paradigma des Information Retrievals steht das Finden von Dokumenten im Vordergrund, die Informationen bzw. Fakten enthalten, die dem vermuteten Informationsbedürfnis des Nutzers entsprechen. Dabei stellt der Nutzer solche Anfragen an das Informationssystem, von denen er annimmt, dass dazu eindeutige Antworten im Informationssystem vorhanden sind, die lediglich zurückgeliefert oder gefunden werden müssen. In vielen Fällen ist der Benutzer aber weniger an den Fakten selber interessiert, als vielmehr daran, wie über Fakten berichtet wird: Über welche Fakten wird berichtet? Nach welchen Kriterien werden Fakten ausgewählt? Wie werden Fakten bewertet? Welche Konzeptualisierungen der Anwendungsdomäne werden vorausgesetzt? Und wie ändern sich Bewertungen und Konzeptualisierungen über die Zeit? Der vorgestellte Ansatz skizziert eine mögliche Lösung für die explorative Suche in großen Datenmengen.
Notes
Die Volatilität als ein Gradmesser der Kontroverse zielt dabei nicht auf die Polarität der Aussagen ab, d. h. die innere Einstellung des Sprechers zur Sache, wie sie die Sentiment-Analyse untersucht, sondern auf die Unterschiede in den Standpunkten der am Diskurs beteiligten Parteien. Je stärker sich diese Standpunkte unterscheiden, umso stärker weichen auch die verwendeten Vokabulare voneinander ab, mittels derer diese Standpunkte vertreten werden. Was für den einen unvermeidbar ist, kann für den anderen unvertretbar sein.
Aufgrund des Schwarz-weiß-Drucks des Magazins sind möglicherweise in diesem Artikel beschriebene visuelle Effekte weniger deutlich sichtbar, speziell die recht wichtige Unterscheidung zwischen dem Farbverlauf und Weiß für fehlende Daten. In der Anwendung kann zwischen einer Darstellung im RGB- und HSI-Farbraum umgeschaltet werden.
Literatur
Broder A (2002) A taxonomy of web search. SIGIR Forum 36(2):3–10
Couvering EV (2005) Web behaviour: search engines in context
Fluit C, Sabou M, van Harmelen F (2005) Ontology-based information visualisation: towards semantic web applications. In: Geroimenko V (Hrsg) Visualising the semantic web, 2nd Aufl. Springer, Berlin
Geng L, Hamilton HJ (2006) Interestingness measures for data mining: a survey. ACM Comput Surv 38(3)
Gottwald S, Richter M, Heyer G, Scheuermann G (2008) Tapping huge temporally indexed textual resources with wctanalyze. In: Proceedings of the LREC 2008, Marrakech, Morroco
Heim P, Ziegler J (2011) Faceted visual exploration of semantic data. In: Achim E, Allan D, Gershon N, Pohl M (Hrsg) Human aspects of visualization. Lecture notes in computer science, Bd 6431. Springer, Berlin, S 58–75
Heyer G, Holz F, Teresniak S (2009) Change of topics over time—tracking topics by their change of meaning. In: Proc of int conf on knowledge discovery and information retrieval (KDIR ’09)
Holz F, Teresniak S (2010) Towards automatic detection and tracking of topic change. In: Gelbukh A (Hrsg) Proc Iaşi: conference on intelligent text processing and computational linguistics (CICLing 2010). Lecture notes in computer science, Bd 6008. Springer, Berlin
Keim DA (2000) Designing pixel-oriented visualization techniques: theory and applications. IEEE Trans Vis Comput Graph 6(1):59–78
Keim DA, Kohlhammer J, Ellis G, Mansmann F (2010) Mastering the information age—solving problems with visual analytics. In: Eurographics
Kleinberg J (2002) Bursty and hierarchical structure in streams. In: Proceedings of the eighth ACM SIGKDD international conference on knowledge discovery and data mining (KDD ’02), New York, NY, USA. ACM, New York, S 91–101
Kumaran G, Allan J (2004) Text classification and named entities for new event detection. In: Proceedings of the 27th annual international ACM SIGIR conference on research and development in information retrieval (SIGIR ’04), New York, NY, USA. ACM, New York, S 297–304
Marchionini G (2006) Exploratory search: from finding to understanding. Commun ACM 49:41–46
Matthews M, Tolchinsky P, Blanco R, Atserias J, Mika P, Zaragoza H (2010) Searching through time in the New York Times. In: HCIR Challange 2010
Rasmussen E (2009) Characterizing, supporting and evaluating exploratory search. In: Belkin N, Marchionini G (Hrsg) Proceedings of the NSF workshop, information seeking support systems, Chapel Hill, University of Carolina, S 30–32
Rohrdantz C, Koch S, Jochim C, Heyer G, Scheuermann G, Ertl T, Schütze H, Keim DA (2010) Visuelle textanalyse. Inform.-Spektrum 33:601–611. 10.1007/s00287-010-0483-x
Shneiderman B, Byrd D, Croft BW (1997) Clarifying search: a user-interface framework for text searches. D-Lib Mag
Soboroff I, Harman D (2005) Novelty detection: the TREC experience. In: In HLT/EMNLP, S 105–112
Swan R, Allan J (1999) Extracting significant time varying features from text. In: Proceedings of the eighth international conference on information and knowledge management (CIKM ’99), New York, NY, USA. ACM, New York, S 38–45
Teresniak S, Heyer G, Scheuermann G, Holz F (2009) Visualisierung von bedeutungsverschiebungen in großen diachronen dokumentkollektionen. Datenbank-Spektrum 31:33–39
Ueberall M, Drobnik O (2007) Facet-based exploratory search in topic maps. In: Maicher L, Garshol LM (Hrsg) Proc fourth int’l conference on topic maps research and applications (TMRA), 2007. Leipziger Informatik-Verbund, Leipzig
Waitelonis J, Knuth M, Wolf L, Hercher J, Sack H (2010) The path is the destination—enabling a new search paradigm with linked data. In: Proc of linked data in the future internet at the future internet assembly, S 700
Wang X, McCallum A (2006) Topics over time: a non-Markov continuous-time model of topical trends. In: Proceedings of the 12th ACM SIGKDD international conference on knowledge discovery and data mining (KDD ’06), New York, NY, USA. ACM, New York, S 424–433
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Heyer, G., Keim, D., Teresniak, S. et al. Interaktive explorative Suche in großen Dokumentbeständen. Datenbank Spektrum 11, 195–206 (2011). https://doi.org/10.1007/s13222-011-0072-4
Received:
Accepted:
Published:
Issue Date:
DOI: https://doi.org/10.1007/s13222-011-0072-4