Skip to main content

Ein KI-basiertes Framework für Sprach- und Stimmanalyse zur automatischen Bewertung der Qualität von Servicegesprächen

  • Chapter
  • First Online:
Künstliche Intelligenz in der Anwendung

Part of the book series: Angewandte Wirtschaftsinformatik ((ANWI))

Zusammenfassung

In diesem Kapitel wird ein innovatives zweistufiges Klassifikationsframework vorgestellt, das auf Basis multipler Modelle für den Sprechausdruck qualitätsinduzierende Kriterien bei Callcentergesprächen mit erklärungsfähigen Regeln prognostizieren kann. Durch diese Basisklassifikation wird eine symbolische Repräsentation des Sprechausdrucks erzeugt, die sowohl für Experten verständlich ist als auch von Klassifikationsalgorithmen verarbeitet werden kann. In der zweiten Stufe werden mit Lernverfahren die erkannten sprecherisch-stimmlichen Merkmale zu einer Klassifikation der Qualitätsfaktoren zusammengeführt. Regeln und Entscheidungsbäume bilden die funktionalen Beziehungen zu den relevanten Merkmalen ab und können so anhand der erkannten sprecherisch-stimmlichen Merkmale die wahrgenommenen Qualitätsfaktoren erklären.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 39.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Literatur

  1. Bose I (2003) dóch da sin ja‘ nur mûster: Kindlicher Sprechausdruck im sozialen Rollenspiel. Peter, Frankfurt

    Google Scholar 

  2. Burkhardt F, Audibert N, Malatesta L, Türk O, Arslan L, Auberge V (2006) Emotional Prosody – does culture make a difference. Speech Prosody 2(5)

    Google Scholar 

  3. Chang H (2007) Comparing machine and human performance for caller’s directory assistance requests. Int J Speech Technol 10(2):75–87

    Article  Google Scholar 

  4. Devillers L, Lamel L, Vasilescu I (2003) Emotion detection in task-oriented spoken dialogues. In: Multimedia and Expo, 2003. ICME’03. Proceedings. 2003 International Conference on. IEEE, III–549

    Google Scholar 

  5. Eyben F, Wöllmer M, Schuller B (2009) openEAR – introducing the Munich open-source emotion and affect recognition toolkit. In: Proc. 4th International HUMAINE Association Conference on Affective Computing and Intelligent Interaction 2009 (ACII2009), Band I, 576–581. IEEE, 2009

    Google Scholar 

  6. Focsa I, Neuhaus T (2003) Aufbau eines Qualitätsmanagementsystems im Call Center. GfAH Selbstverlag, Dortmund, 17–38

    Google Scholar 

  7. Fojut S (2008) Call Center Lexikon: Die wichtigsten Fachbegriffe der Branche verständlich erklärt. Gabler, Wiesbaden

    Google Scholar 

  8. Gavalda M, Schlueter J (2010) „The truth is out there“: using advanced speech analytics to learn why customers call help-line desks and how effectively they are being served by the call center agent. In: Advances in speech recognition. Springer, Berlin, 221–243

    Google Scholar 

  9. Hall M, Frank E, Holmes G et al. (2009) The WEKA data mining software: an update. SIGKDD Explor Newsl 11(1):10–18

    Google Scholar 

  10. Hirschfeld U, Neuber B (2011) Optimierungsmöglichkeiten der Telekommunikation aus Sicht der Sprechwissenschaft – Überblick über Fragestellungen und Untersuchungsansätze. In: Hirschfeld U, Neuber B (Hrsg) Erforschung und Optimierung der Callcenterkommunikation. Frank & Timme, Berlin, 9–28

    Google Scholar 

  11. Lassmann W (Hrsg.), Rogge R, Schwarzer J (2006) Wirtschaftsinformatik: Nachschlagewerk für Studium und Praxis. Gabler, Wiesbaden

    Google Scholar 

  12. Lefter I, Wiggers P, Rothkrantz L (2010) EmoReSp: an online emotion recognizer based on speech. In: Proceedings of the 11th International Conference on Computer Systems and Technologies and Workshop for PhD Students in Computing on International Conference on Computer Systems and Technologies. ACM, New York, (CompSysTech ’10), 287–292

    Google Scholar 

  13. Meißner S, Pietschmann J (2011a) Rhetorische und phonetische Einflussfaktoren auf die Qualität von Telefonverkaufsgesprächen. In: Hirschfeld U, Neuber B (Hrsg) Erforschung und Optimierung der Callcenterkommunikation. Frank & Timme, Berlin, 215–248

    Google Scholar 

  14. Meißner S, Pietschmann J (2011b) Zur Beurteilung der Gesprächsqualität im telefonischen Verkauf – Zwischenbericht über ein Forschungsprojekt. In: Bose I, Neuber B (Hrsg) Interpersonale Kommunikation: Analyse und Optimierung. Lang, Frankfurt, S 303–312

    Google Scholar 

  15. Mishne G, Carmel D, Hoory R, Roytman A, Soffer A (2005) Automatic analysis of call-center conversations. In: Proceedings of the 14th ACM international conference on Information and knowledge management. ACM, 453–459

    Google Scholar 

  16. Morrison D, Wang R, De Silva, Liyanage (2007) Ensemble methods for spoken emotion recognition in call-centres. Speech Commun 49(2):98–112

    Google Scholar 

  17. Neuber B, Hirschfeld U (2013) Sprechwirkungsforschung in der professionellen Telefonie. In: Veličkova L, Petročenko E (Hrsg) Klangsprache im Fremdsprachenunterricht, Bd. VII. Voronezh State University, Voronezh, 66–85

    Google Scholar 

  18. Neppert J, Pétursson M (1986) Elemente einer Akustischen Phonetik, 2. Aufl. Helmut Buske, Hamburg

    Google Scholar 

  19. Paeschke A (2003) Prosodische Analyse emotionaler Sprechweise. Logos, Berlin (Mündliche Kommunikation)

    Google Scholar 

  20. Petrushin V (1999) Emotion in speech: recognition and application to call centers. In: Artificial Neural Nets in Engineering (ANNIE ’99), 7–14

    Google Scholar 

  21. Pfister B, Kaufmann T (2008) Sprachverarbeitung. Springer, Berlin

    Google Scholar 

  22. Pittermann J, Pittermann A (2006): Integrating emotion recognition into an adaptive spoken language dialogue system. In: Intelligent Environments, 2006. IE 06. 2nd IET International Conference on. IET, 197–202

    Google Scholar 

  23. Scherer K (2013) Vocal markers of emotion: comparing induction and acting elicitation. Comput Speech Lang 27(1):40–58

    Article  Google Scholar 

  24. Schuller B, Batliner A (2014) Computational paralinguistics: emotion, affect and personality in speech and language processing. Wiley, New York

    Google Scholar 

  25. Schuller B, Steidl S, Batliner A, et al. (2012) The INTERSPEECH 2012 Speaker Trait Challenge. In: Proceedings INTERSPEECH

    Google Scholar 

  26. Schuller B, Steidl S, Batliner A, et al. (2010) The INTERSPEECH 2010 Paralinguistic Challenge. In: Proceedings INTERSPEECH, 2795–2798

    Google Scholar 

  27. Stahlknecht P, Hasenkamp U (1999) Einführung in die Wirtschaftsinformatik, 9. Aufl. Springer, Berlin

    Book  Google Scholar 

  28. Thompson W, Balkwill L (2006) Decoding speech prosody in five languages. Semiotica 2006(158):407–424

    Article  Google Scholar 

  29. Vidrascu L, Devillers L (2007) Five emotion classes detection in real-world call center data: the use of various types of paralinguistic features. In: Proceedings of the International Workshop on Paralinguistic Speech – between Models and Data. Citeseer, 11–16

    Google Scholar 

  30. Walther M (2018) Automatische Erkennung paralinguistischer Merkmale zur Bewertung der Gesprächsqualität in Callcentern: Zweistufige maschinelle Klassifikation mittels multipler Lernverfahren und perzeptiver Kriterien. In: Hoffmann R (Hrsg) Studientexte zur Sprachkommunikation, Bd. 89. TUDpress, Dresden

    Google Scholar 

  31. Walther M, Neuber B, Jokisch O, Mellouli T (2015) Towards a conversational expert system for rhetorical and vocal quality assessment in call center talks. SlaTE 2015:29–34

    Google Scholar 

  32. Walther M, Mellouli T (2017) „Intelligente Systeme zur Bewertung der Gesprächsqualität im Callcenter – Stand der Forschung und experimentelle Ergebnisse”. In: Neuber B, Pietschmann J (Hrsg) Dialogoptimierung in der Telekommunikation. Bd. 9. Schriften zur Sprechwissenschaft und Phonetik. Frank & Timme, Berlin

    Google Scholar 

  33. Walther M, Mellouli T, Jokisch O (2015) Fusion von Klassifikationsmodellen zur automatischen Erkennung von Stimmeigenschaften in der Qualitätsbewertung von Callcentergesprächen. In: Wirsching G (Hrsg) ESSV 2015. TUDpress, Dresden, 188–195

    Google Scholar 

  34. Weninger F, Wöllmer M, Schuller B (2014) Emotion recognition in naturalistic speech and language – a survey. In: Konar A, Chakraborty A (Hrsg) Emotion recognition: a pattern analysis approach. Wiley, New Jersey, 237–268

    Google Scholar 

  35. Yacoub S, Simske S, Lin X, Burns J (2003) Recognition of emotions in interactive voice response systems. Eurospeech 2003:1–4

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Mathias Walther .

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 2021 Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature

About this chapter

Check for updates. Verify currency and authenticity via CrossMark

Cite this chapter

Walther, M. (2021). Ein KI-basiertes Framework für Sprach- und Stimmanalyse zur automatischen Bewertung der Qualität von Servicegesprächen. In: Barton, T., Müller, C. (eds) Künstliche Intelligenz in der Anwendung. Angewandte Wirtschaftsinformatik. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-30936-7_13

Download citation

Publish with us

Policies and ethics