Skip to main content
Log in

Interaktive explorative Suche in großen Dokumentbeständen

  • Schwerpunktbeitrag
  • Published:
Datenbank-Spektrum Aims and scope Submit manuscript

Zusammenfassung

Im klassischen Paradigma des Information Retrievals steht das Finden von Dokumenten im Vordergrund, die Informationen bzw. Fakten enthalten, die dem vermuteten Informationsbedürfnis des Nutzers entsprechen. Dabei stellt der Nutzer solche Anfragen an das Informationssystem, von denen er annimmt, dass dazu eindeutige Antworten im Informationssystem vorhanden sind, die lediglich zurückgeliefert oder gefunden werden müssen. In vielen Fällen ist der Benutzer aber weniger an den Fakten selber interessiert, als vielmehr daran, wie über Fakten berichtet wird: Über welche Fakten wird berichtet? Nach welchen Kriterien werden Fakten ausgewählt? Wie werden Fakten bewertet? Welche Konzeptualisierungen der Anwendungsdomäne werden vorausgesetzt? Und wie ändern sich Bewertungen und Konzeptualisierungen über die Zeit? Der vorgestellte Ansatz skizziert eine mögliche Lösung für die explorative Suche in großen Datenmengen.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Abb. 1
Abb. 2
Abb. 3
Abb. 4
Abb. 5
Abb. 6
Abb. 7

Notes

  1. http://livingknowledge.europarchive.org/.

  2. Die Volatilität als ein Gradmesser der Kontroverse zielt dabei nicht auf die Polarität der Aussagen ab, d. h. die innere Einstellung des Sprechers zur Sache, wie sie die Sentiment-Analyse untersucht, sondern auf die Unterschiede in den Standpunkten der am Diskurs beteiligten Parteien. Je stärker sich diese Standpunkte unterscheiden, umso stärker weichen auch die verwendeten Vokabulare voneinander ab, mittels derer diese Standpunkte vertreten werden. Was für den einen unvermeidbar ist, kann für den anderen unvertretbar sein.

  3. http://www.visual-analytics.de/.

  4. http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2008T19.

  5. Aufgrund des Schwarz-weiß-Drucks des Magazins sind möglicherweise in diesem Artikel beschriebene visuelle Effekte weniger deutlich sichtbar, speziell die recht wichtige Unterscheidung zwischen dem Farbverlauf und Weiß für fehlende Daten. In der Anwendung kann zwischen einer Darstellung im RGB- und HSI-Farbraum umgeschaltet werden.

Literatur

  1. Broder A (2002) A taxonomy of web search. SIGIR Forum 36(2):3–10

    Article  Google Scholar 

  2. Couvering EV (2005) Web behaviour: search engines in context

  3. Fluit C, Sabou M, van Harmelen F (2005) Ontology-based information visualisation: towards semantic web applications. In: Geroimenko V (Hrsg) Visualising the semantic web, 2nd Aufl. Springer, Berlin

    Google Scholar 

  4. Geng L, Hamilton HJ (2006) Interestingness measures for data mining: a survey. ACM Comput Surv 38(3)

  5. Gottwald S, Richter M, Heyer G, Scheuermann G (2008) Tapping huge temporally indexed textual resources with wctanalyze. In: Proceedings of the LREC 2008, Marrakech, Morroco

    Google Scholar 

  6. Heim P, Ziegler J (2011) Faceted visual exploration of semantic data. In: Achim E, Allan D, Gershon N, Pohl M (Hrsg) Human aspects of visualization. Lecture notes in computer science, Bd 6431. Springer, Berlin, S 58–75

    Chapter  Google Scholar 

  7. Heyer G, Holz F, Teresniak S (2009) Change of topics over time—tracking topics by their change of meaning. In: Proc of int conf on knowledge discovery and information retrieval (KDIR ’09)

    Google Scholar 

  8. Holz F, Teresniak S (2010) Towards automatic detection and tracking of topic change. In: Gelbukh A (Hrsg) Proc Iaşi: conference on intelligent text processing and computational linguistics (CICLing 2010). Lecture notes in computer science, Bd 6008. Springer, Berlin

    Google Scholar 

  9. Keim DA (2000) Designing pixel-oriented visualization techniques: theory and applications. IEEE Trans Vis Comput Graph 6(1):59–78

    Article  Google Scholar 

  10. Keim DA, Kohlhammer J, Ellis G, Mansmann F (2010) Mastering the information age—solving problems with visual analytics. In: Eurographics

    Google Scholar 

  11. Kleinberg J (2002) Bursty and hierarchical structure in streams. In: Proceedings of the eighth ACM SIGKDD international conference on knowledge discovery and data mining (KDD ’02), New York, NY, USA. ACM, New York, S 91–101

    Chapter  Google Scholar 

  12. Kumaran G, Allan J (2004) Text classification and named entities for new event detection. In: Proceedings of the 27th annual international ACM SIGIR conference on research and development in information retrieval (SIGIR ’04), New York, NY, USA. ACM, New York, S 297–304

    Google Scholar 

  13. Marchionini G (2006) Exploratory search: from finding to understanding. Commun ACM 49:41–46

    Article  Google Scholar 

  14. Matthews M, Tolchinsky P, Blanco R, Atserias J, Mika P, Zaragoza H (2010) Searching through time in the New York Times. In: HCIR Challange 2010

    Google Scholar 

  15. Rasmussen E (2009) Characterizing, supporting and evaluating exploratory search. In: Belkin N, Marchionini G (Hrsg) Proceedings of the NSF workshop, information seeking support systems, Chapel Hill, University of Carolina, S 30–32

    Google Scholar 

  16. Rohrdantz C, Koch S, Jochim C, Heyer G, Scheuermann G, Ertl T, Schütze H, Keim DA (2010) Visuelle textanalyse. Inform.-Spektrum 33:601–611. 10.1007/s00287-010-0483-x

    Article  Google Scholar 

  17. Shneiderman B, Byrd D, Croft BW (1997) Clarifying search: a user-interface framework for text searches. D-Lib Mag

  18. Soboroff I, Harman D (2005) Novelty detection: the TREC experience. In: In HLT/EMNLP, S 105–112

    Google Scholar 

  19. Swan R, Allan J (1999) Extracting significant time varying features from text. In: Proceedings of the eighth international conference on information and knowledge management (CIKM ’99), New York, NY, USA. ACM, New York, S 38–45

    Chapter  Google Scholar 

  20. Teresniak S, Heyer G, Scheuermann G, Holz F (2009) Visualisierung von bedeutungsverschiebungen in großen diachronen dokumentkollektionen. Datenbank-Spektrum 31:33–39

    Google Scholar 

  21. Ueberall M, Drobnik O (2007) Facet-based exploratory search in topic maps. In: Maicher L, Garshol LM (Hrsg) Proc fourth int’l conference on topic maps research and applications (TMRA), 2007. Leipziger Informatik-Verbund, Leipzig

    Google Scholar 

  22. Waitelonis J, Knuth M, Wolf L, Hercher J, Sack H (2010) The path is the destination—enabling a new search paradigm with linked data. In: Proc of linked data in the future internet at the future internet assembly, S 700

    Google Scholar 

  23. Wang X, McCallum A (2006) Topics over time: a non-Markov continuous-time model of topical trends. In: Proceedings of the 12th ACM SIGKDD international conference on knowledge discovery and data mining (KDD ’06), New York, NY, USA. ACM, New York, S 424–433

    Chapter  Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Sven Teresniak.

Rights and permissions

Reprints and permissions

About this article

Cite this article

Heyer, G., Keim, D., Teresniak, S. et al. Interaktive explorative Suche in großen Dokumentbeständen. Datenbank Spektrum 11, 195–206 (2011). https://doi.org/10.1007/s13222-011-0072-4

Download citation

  • Received:

  • Accepted:

  • Published:

  • Issue Date:

  • DOI: https://doi.org/10.1007/s13222-011-0072-4

Navigation