Ein KI-basiertes Framework für Sprach- und Stimmanalyse zur automatischen Bewertung der Qualität von Servicegesprächen

Walther, Mathias

doi:10.1007/978-3-658-30936-7_13

Mathias Walther⁵

Part of the book series: Angewandte Wirtschaftsinformatik ((ANWI))

16k Accesses
1 Citations

Zusammenfassung

In diesem Kapitel wird ein innovatives zweistufiges Klassifikationsframework vorgestellt, das auf Basis multipler Modelle für den Sprechausdruck qualitätsinduzierende Kriterien bei Callcentergesprächen mit erklärungsfähigen Regeln prognostizieren kann. Durch diese Basisklassifikation wird eine symbolische Repräsentation des Sprechausdrucks erzeugt, die sowohl für Experten verständlich ist als auch von Klassifikationsalgorithmen verarbeitet werden kann. In der zweiten Stufe werden mit Lernverfahren die erkannten sprecherisch-stimmlichen Merkmale zu einer Klassifikation der Qualitätsfaktoren zusammengeführt. Regeln und Entscheidungsbäume bilden die funktionalen Beziehungen zu den relevanten Merkmalen ab und können so anhand der erkannten sprecherisch-stimmlichen Merkmale die wahrgenommenen Qualitätsfaktoren erklären.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 39.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Literatur

Bose I (2003) dóch da sin ja‘ nur mûster: Kindlicher Sprechausdruck im sozialen Rollenspiel. Peter, Frankfurt
Google Scholar
Burkhardt F, Audibert N, Malatesta L, Türk O, Arslan L, Auberge V (2006) Emotional Prosody – does culture make a difference. Speech Prosody 2(5)
Google Scholar
Chang H (2007) Comparing machine and human performance for caller’s directory assistance requests. Int J Speech Technol 10(2):75–87
Article Google Scholar
Devillers L, Lamel L, Vasilescu I (2003) Emotion detection in task-oriented spoken dialogues. In: Multimedia and Expo, 2003. ICME’03. Proceedings. 2003 International Conference on. IEEE, III–549
Google Scholar
Eyben F, Wöllmer M, Schuller B (2009) openEAR – introducing the Munich open-source emotion and affect recognition toolkit. In: Proc. 4th International HUMAINE Association Conference on Affective Computing and Intelligent Interaction 2009 (ACII2009), Band I, 576–581. IEEE, 2009
Google Scholar
Focsa I, Neuhaus T (2003) Aufbau eines Qualitätsmanagementsystems im Call Center. GfAH Selbstverlag, Dortmund, 17–38
Google Scholar
Fojut S (2008) Call Center Lexikon: Die wichtigsten Fachbegriffe der Branche verständlich erklärt. Gabler, Wiesbaden
Google Scholar
Gavalda M, Schlueter J (2010) „The truth is out there“: using advanced speech analytics to learn why customers call help-line desks and how effectively they are being served by the call center agent. In: Advances in speech recognition. Springer, Berlin, 221–243
Google Scholar
Hall M, Frank E, Holmes G et al. (2009) The WEKA data mining software: an update. SIGKDD Explor Newsl 11(1):10–18
Google Scholar
Hirschfeld U, Neuber B (2011) Optimierungsmöglichkeiten der Telekommunikation aus Sicht der Sprechwissenschaft – Überblick über Fragestellungen und Untersuchungsansätze. In: Hirschfeld U, Neuber B (Hrsg) Erforschung und Optimierung der Callcenterkommunikation. Frank & Timme, Berlin, 9–28
Google Scholar
Lassmann W (Hrsg.), Rogge R, Schwarzer J (2006) Wirtschaftsinformatik: Nachschlagewerk für Studium und Praxis. Gabler, Wiesbaden
Google Scholar
Lefter I, Wiggers P, Rothkrantz L (2010) EmoReSp: an online emotion recognizer based on speech. In: Proceedings of the 11th International Conference on Computer Systems and Technologies and Workshop for PhD Students in Computing on International Conference on Computer Systems and Technologies. ACM, New York, (CompSysTech ’10), 287–292
Google Scholar
Meißner S, Pietschmann J (2011a) Rhetorische und phonetische Einflussfaktoren auf die Qualität von Telefonverkaufsgesprächen. In: Hirschfeld U, Neuber B (Hrsg) Erforschung und Optimierung der Callcenterkommunikation. Frank & Timme, Berlin, 215–248
Google Scholar
Meißner S, Pietschmann J (2011b) Zur Beurteilung der Gesprächsqualität im telefonischen Verkauf – Zwischenbericht über ein Forschungsprojekt. In: Bose I, Neuber B (Hrsg) Interpersonale Kommunikation: Analyse und Optimierung. Lang, Frankfurt, S 303–312
Google Scholar
Mishne G, Carmel D, Hoory R, Roytman A, Soffer A (2005) Automatic analysis of call-center conversations. In: Proceedings of the 14th ACM international conference on Information and knowledge management. ACM, 453–459
Google Scholar
Morrison D, Wang R, De Silva, Liyanage (2007) Ensemble methods for spoken emotion recognition in call-centres. Speech Commun 49(2):98–112
Google Scholar
Neuber B, Hirschfeld U (2013) Sprechwirkungsforschung in der professionellen Telefonie. In: Veličkova L, Petročenko E (Hrsg) Klangsprache im Fremdsprachenunterricht, Bd. VII. Voronezh State University, Voronezh, 66–85
Google Scholar
Neppert J, Pétursson M (1986) Elemente einer Akustischen Phonetik, 2. Aufl. Helmut Buske, Hamburg
Google Scholar
Paeschke A (2003) Prosodische Analyse emotionaler Sprechweise. Logos, Berlin (Mündliche Kommunikation)
Google Scholar
Petrushin V (1999) Emotion in speech: recognition and application to call centers. In: Artificial Neural Nets in Engineering (ANNIE ’99), 7–14
Google Scholar
Pfister B, Kaufmann T (2008) Sprachverarbeitung. Springer, Berlin
Google Scholar
Pittermann J, Pittermann A (2006): Integrating emotion recognition into an adaptive spoken language dialogue system. In: Intelligent Environments, 2006. IE 06. 2nd IET International Conference on. IET, 197–202
Google Scholar
Scherer K (2013) Vocal markers of emotion: comparing induction and acting elicitation. Comput Speech Lang 27(1):40–58
Article Google Scholar
Schuller B, Batliner A (2014) Computational paralinguistics: emotion, affect and personality in speech and language processing. Wiley, New York
Google Scholar
Schuller B, Steidl S, Batliner A, et al. (2012) The INTERSPEECH 2012 Speaker Trait Challenge. In: Proceedings INTERSPEECH
Google Scholar
Schuller B, Steidl S, Batliner A, et al. (2010) The INTERSPEECH 2010 Paralinguistic Challenge. In: Proceedings INTERSPEECH, 2795–2798
Google Scholar
Stahlknecht P, Hasenkamp U (1999) Einführung in die Wirtschaftsinformatik, 9. Aufl. Springer, Berlin
Book Google Scholar
Thompson W, Balkwill L (2006) Decoding speech prosody in five languages. Semiotica 2006(158):407–424
Article Google Scholar
Vidrascu L, Devillers L (2007) Five emotion classes detection in real-world call center data: the use of various types of paralinguistic features. In: Proceedings of the International Workshop on Paralinguistic Speech – between Models and Data. Citeseer, 11–16
Google Scholar
Walther M (2018) Automatische Erkennung paralinguistischer Merkmale zur Bewertung der Gesprächsqualität in Callcentern: Zweistufige maschinelle Klassifikation mittels multipler Lernverfahren und perzeptiver Kriterien. In: Hoffmann R (Hrsg) Studientexte zur Sprachkommunikation, Bd. 89. TUDpress, Dresden
Google Scholar
Walther M, Neuber B, Jokisch O, Mellouli T (2015) Towards a conversational expert system for rhetorical and vocal quality assessment in call center talks. SlaTE 2015:29–34
Google Scholar
Walther M, Mellouli T (2017) „Intelligente Systeme zur Bewertung der Gesprächsqualität im Callcenter – Stand der Forschung und experimentelle Ergebnisse”. In: Neuber B, Pietschmann J (Hrsg) Dialogoptimierung in der Telekommunikation. Bd. 9. Schriften zur Sprechwissenschaft und Phonetik. Frank & Timme, Berlin
Google Scholar
Walther M, Mellouli T, Jokisch O (2015) Fusion von Klassifikationsmodellen zur automatischen Erkennung von Stimmeigenschaften in der Qualitätsbewertung von Callcentergesprächen. In: Wirsching G (Hrsg) ESSV 2015. TUDpress, Dresden, 188–195
Google Scholar
Weninger F, Wöllmer M, Schuller B (2014) Emotion recognition in naturalistic speech and language – a survey. In: Konar A, Chakraborty A (Hrsg) Emotion recognition: a pattern analysis approach. Wiley, New Jersey, 237–268
Google Scholar
Yacoub S, Simske S, Lin X, Burns J (2003) Recognition of emotions in interactive voice response systems. Eurospeech 2003:1–4
Google Scholar

Download references

Author information

Authors and Affiliations

Technische Hochschule Wildau, Wildau, Deutschland
Mathias Walther

Authors

Mathias Walther
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Mathias Walther .

Editor information

Editors and Affiliations

FB Informatik, Hochschule Worms, Worms, Germany
Thomas Barton
FB Wirtschaft, Informatik, Recht (WIR), Technische Hochschule Wildau, Wildau, Germany
Christian Müller

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Walther, M. (2021). Ein KI-basiertes Framework für Sprach- und Stimmanalyse zur automatischen Bewertung der Qualität von Servicegesprächen. In: Barton, T., Müller, C. (eds) Künstliche Intelligenz in der Anwendung. Angewandte Wirtschaftsinformatik. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-30936-7_13

Download citation

DOI: https://doi.org/10.1007/978-3-658-30936-7_13
Published: 03 February 2021
Publisher Name: Springer Vieweg, Wiesbaden
Print ISBN: 978-3-658-30935-0
Online ISBN: 978-3-658-30936-7
eBook Packages: Computer Science and Engineering (German Language)

Publish with us

Policies and ethics