Zusammenfassung
In diesem Kapitel wird ein innovatives zweistufiges Klassifikationsframework vorgestellt, das auf Basis multipler Modelle für den Sprechausdruck qualitätsinduzierende Kriterien bei Callcentergesprächen mit erklärungsfähigen Regeln prognostizieren kann. Durch diese Basisklassifikation wird eine symbolische Repräsentation des Sprechausdrucks erzeugt, die sowohl für Experten verständlich ist als auch von Klassifikationsalgorithmen verarbeitet werden kann. In der zweiten Stufe werden mit Lernverfahren die erkannten sprecherisch-stimmlichen Merkmale zu einer Klassifikation der Qualitätsfaktoren zusammengeführt. Regeln und Entscheidungsbäume bilden die funktionalen Beziehungen zu den relevanten Merkmalen ab und können so anhand der erkannten sprecherisch-stimmlichen Merkmale die wahrgenommenen Qualitätsfaktoren erklären.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Literatur
Bose I (2003) dóch da sin ja‘ nur mûster: Kindlicher Sprechausdruck im sozialen Rollenspiel. Peter, Frankfurt
Burkhardt F, Audibert N, Malatesta L, Türk O, Arslan L, Auberge V (2006) Emotional Prosody – does culture make a difference. Speech Prosody 2(5)
Chang H (2007) Comparing machine and human performance for caller’s directory assistance requests. Int J Speech Technol 10(2):75–87
Devillers L, Lamel L, Vasilescu I (2003) Emotion detection in task-oriented spoken dialogues. In: Multimedia and Expo, 2003. ICME’03. Proceedings. 2003 International Conference on. IEEE, III–549
Eyben F, Wöllmer M, Schuller B (2009) openEAR – introducing the Munich open-source emotion and affect recognition toolkit. In: Proc. 4th International HUMAINE Association Conference on Affective Computing and Intelligent Interaction 2009 (ACII2009), Band I, 576–581. IEEE, 2009
Focsa I, Neuhaus T (2003) Aufbau eines Qualitätsmanagementsystems im Call Center. GfAH Selbstverlag, Dortmund, 17–38
Fojut S (2008) Call Center Lexikon: Die wichtigsten Fachbegriffe der Branche verständlich erklärt. Gabler, Wiesbaden
Gavalda M, Schlueter J (2010) „The truth is out there“: using advanced speech analytics to learn why customers call help-line desks and how effectively they are being served by the call center agent. In: Advances in speech recognition. Springer, Berlin, 221–243
Hall M, Frank E, Holmes G et al. (2009) The WEKA data mining software: an update. SIGKDD Explor Newsl 11(1):10–18
Hirschfeld U, Neuber B (2011) Optimierungsmöglichkeiten der Telekommunikation aus Sicht der Sprechwissenschaft – Überblick über Fragestellungen und Untersuchungsansätze. In: Hirschfeld U, Neuber B (Hrsg) Erforschung und Optimierung der Callcenterkommunikation. Frank & Timme, Berlin, 9–28
Lassmann W (Hrsg.), Rogge R, Schwarzer J (2006) Wirtschaftsinformatik: Nachschlagewerk für Studium und Praxis. Gabler, Wiesbaden
Lefter I, Wiggers P, Rothkrantz L (2010) EmoReSp: an online emotion recognizer based on speech. In: Proceedings of the 11th International Conference on Computer Systems and Technologies and Workshop for PhD Students in Computing on International Conference on Computer Systems and Technologies. ACM, New York, (CompSysTech ’10), 287–292
Meißner S, Pietschmann J (2011a) Rhetorische und phonetische Einflussfaktoren auf die Qualität von Telefonverkaufsgesprächen. In: Hirschfeld U, Neuber B (Hrsg) Erforschung und Optimierung der Callcenterkommunikation. Frank & Timme, Berlin, 215–248
Meißner S, Pietschmann J (2011b) Zur Beurteilung der Gesprächsqualität im telefonischen Verkauf – Zwischenbericht über ein Forschungsprojekt. In: Bose I, Neuber B (Hrsg) Interpersonale Kommunikation: Analyse und Optimierung. Lang, Frankfurt, S 303–312
Mishne G, Carmel D, Hoory R, Roytman A, Soffer A (2005) Automatic analysis of call-center conversations. In: Proceedings of the 14th ACM international conference on Information and knowledge management. ACM, 453–459
Morrison D, Wang R, De Silva, Liyanage (2007) Ensemble methods for spoken emotion recognition in call-centres. Speech Commun 49(2):98–112
Neuber B, Hirschfeld U (2013) Sprechwirkungsforschung in der professionellen Telefonie. In: Veličkova L, Petročenko E (Hrsg) Klangsprache im Fremdsprachenunterricht, Bd. VII. Voronezh State University, Voronezh, 66–85
Neppert J, Pétursson M (1986) Elemente einer Akustischen Phonetik, 2. Aufl. Helmut Buske, Hamburg
Paeschke A (2003) Prosodische Analyse emotionaler Sprechweise. Logos, Berlin (Mündliche Kommunikation)
Petrushin V (1999) Emotion in speech: recognition and application to call centers. In: Artificial Neural Nets in Engineering (ANNIE ’99), 7–14
Pfister B, Kaufmann T (2008) Sprachverarbeitung. Springer, Berlin
Pittermann J, Pittermann A (2006): Integrating emotion recognition into an adaptive spoken language dialogue system. In: Intelligent Environments, 2006. IE 06. 2nd IET International Conference on. IET, 197–202
Scherer K (2013) Vocal markers of emotion: comparing induction and acting elicitation. Comput Speech Lang 27(1):40–58
Schuller B, Batliner A (2014) Computational paralinguistics: emotion, affect and personality in speech and language processing. Wiley, New York
Schuller B, Steidl S, Batliner A, et al. (2012) The INTERSPEECH 2012 Speaker Trait Challenge. In: Proceedings INTERSPEECH
Schuller B, Steidl S, Batliner A, et al. (2010) The INTERSPEECH 2010 Paralinguistic Challenge. In: Proceedings INTERSPEECH, 2795–2798
Stahlknecht P, Hasenkamp U (1999) Einführung in die Wirtschaftsinformatik, 9. Aufl. Springer, Berlin
Thompson W, Balkwill L (2006) Decoding speech prosody in five languages. Semiotica 2006(158):407–424
Vidrascu L, Devillers L (2007) Five emotion classes detection in real-world call center data: the use of various types of paralinguistic features. In: Proceedings of the International Workshop on Paralinguistic Speech – between Models and Data. Citeseer, 11–16
Walther M (2018) Automatische Erkennung paralinguistischer Merkmale zur Bewertung der Gesprächsqualität in Callcentern: Zweistufige maschinelle Klassifikation mittels multipler Lernverfahren und perzeptiver Kriterien. In: Hoffmann R (Hrsg) Studientexte zur Sprachkommunikation, Bd. 89. TUDpress, Dresden
Walther M, Neuber B, Jokisch O, Mellouli T (2015) Towards a conversational expert system for rhetorical and vocal quality assessment in call center talks. SlaTE 2015:29–34
Walther M, Mellouli T (2017) „Intelligente Systeme zur Bewertung der Gesprächsqualität im Callcenter – Stand der Forschung und experimentelle Ergebnisse”. In: Neuber B, Pietschmann J (Hrsg) Dialogoptimierung in der Telekommunikation. Bd. 9. Schriften zur Sprechwissenschaft und Phonetik. Frank & Timme, Berlin
Walther M, Mellouli T, Jokisch O (2015) Fusion von Klassifikationsmodellen zur automatischen Erkennung von Stimmeigenschaften in der Qualitätsbewertung von Callcentergesprächen. In: Wirsching G (Hrsg) ESSV 2015. TUDpress, Dresden, 188–195
Weninger F, Wöllmer M, Schuller B (2014) Emotion recognition in naturalistic speech and language – a survey. In: Konar A, Chakraborty A (Hrsg) Emotion recognition: a pattern analysis approach. Wiley, New Jersey, 237–268
Yacoub S, Simske S, Lin X, Burns J (2003) Recognition of emotions in interactive voice response systems. Eurospeech 2003:1–4
Author information
Authors and Affiliations
Corresponding author
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 2021 Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature
About this chapter
Cite this chapter
Walther, M. (2021). Ein KI-basiertes Framework für Sprach- und Stimmanalyse zur automatischen Bewertung der Qualität von Servicegesprächen. In: Barton, T., Müller, C. (eds) Künstliche Intelligenz in der Anwendung. Angewandte Wirtschaftsinformatik. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-30936-7_13
Download citation
DOI: https://doi.org/10.1007/978-3-658-30936-7_13
Published:
Publisher Name: Springer Vieweg, Wiesbaden
Print ISBN: 978-3-658-30935-0
Online ISBN: 978-3-658-30936-7
eBook Packages: Computer Science and Engineering (German Language)