Perception and speech analysis
Glottal wave analysis with Pitch Synchronous Iterative Adaptive Inverse Filtering

https://doi.org/10.1016/0167-6393(92)90005-RGet rights and content

Abstract

A new glottal wave analysis method, Pitch Synchronous Iterative Adaptive Inverse Filtering (PSIAIF) is presented. The algorithm is based on a previously developed method, Iterative Adaptive Inverse Filtering (IAIF). In the IAIF-method the glottal contribution to the speech spectrum is first estimated with an iterative structure. The vocal tract transfer function is modeled after eliminating the average glottal contribution. The glottal excitation is obtained by cancelling the effects of the vocal tract and lip radiation by inverse filtering. In the new PSIAIF-method the glottal pulseform is computed by applying the IAIF-algorithm twice to the same signal. The first IAIF-analysis gives as a result a glottal excitation that spans over several pitch periods. This pulseform is used in order to determine positions and lengths of frames for the pitch synchronous analysis. The final result is obtained by analysing the original speech signal with the IAIF-algorithm one fundamental period at a time. The PSIAIF-algorithm was applied in glottal wave analysis using both synthetic and natural vowels. The results show that the method is able to give a fairly accurate estimate for the glottal flow excluding the analysis of vowels with a low first formant that are produced with a pressed phonation type.

Zusammenfassung

Im vorliegenden Artikel wird ein neues Verfahren zur Analyse des Glottissignals vorgestellt, das Pitch Synchronous Iterative Adaptive Inverse Filtering (PSIAIF). Der Algorithmus basiert auf einer vorher entwickelten Methode (IAIF). Bei der IAIF-Methode wird zunächst der glottale Beitrag zum Sprachspektrum mit einem iterativen Verfahren geschätzt. Die Übertragungsfunktion des Vokaltraktes wird anschlieβend nach Eliminierung des mittleren Glottalbeitrags modelliert. Die Anregung der Glottis wird ermittelt, indem die Einflüsse von Vokaltrakt und Lippenabstrahlung mittels inverser Filterung beseitigt werden. In der neuen PSIAIF-Methode wird die glottale Pulsform dadurch bestimmt, daβ der IAIF-Algorithmus zweimal auf dasselbe Signal angewendet wird. Die erste IAIF-Analyse liefert als Ergebnis die Glottisanregung über mehrere Grundperioden. Diese Pulsform wird dann dazu benutzt, Rahmenpositionen und -längen für die grundperioden-synchrone Analyse zu ermitteln. Das endgültige Ergebnis erhält man, indem das ursprüngliche Sprachsignal in jeweils einer Periode mit dem IAIF-Algorithmus analysiert wird. Der PSIAIF-Algorithmus wurde sowohl unter Verwendung von synthetischen als auch natürlichen Vokalen erprobt. Die Ergebnisse zeigen, daβ das Verfahren dazu in der Lage ist, eine hinreichend genaue Schätzung des Glottissignals anzugeben, mit Ausnahme von Vokalen mit einer niedrigen Frequenz des ersten Formanten und welche durch eine gepresste Aussprache erzeugt werden.

Résumé

On présente une nouvelle méthode d'analyse du flux glottique: le PSIAIF (Pitch Synchronous Iterative Adaptive Inverse Filtering). Cet algorithme se base sur une méthode (IAIF) développée précédemment. La contribution glottique totale au spectre de la parole y était tout d'abord évaluée itérativement. La fonction de transfert du conduit vocal était obtenue après élimination de la contribution glottique moyenne tandis que l'excitation glottique l'était en annulant les effets du conduit vocal et de la radiation labiale par filtrage inverse. Dans la nouvelle méthode, l'onde glottique est calculée en appliquant deux fois l'algorithme IAIF au même signal. La première analyse donne une estimation de l'excitation glottique qui s'étend sur plusieurs périodes. L'onde ainsi obtenue est utilisée ensuite pour déterminer les positions et les longueurs des fenêtres d'analyse synchronisées. Pour obtenir le résultat final, il ne rest plus qu'à analyser le signal original de la parole, période fondamentale par période fondamentale, avec l'algorithme IAIF. L'algorithme PSIAIF a été appliqué à l'analyse du signal glottique, dans le cas de voyelles naturelles et synthétiques. Les résultats montrent que la méthode est capable de fournir une estimation relativement précise de flux glottique, si l'on exclut l'analyse des voyelles à premier formant bas produites par un type de phonation pressée.

References (10)

  • P. Alku et al.

    A comparison of EGG and a new inverse filtering method in phonation change from breathy to normal

  • P. Alku et al.

    Analysis of glottal waveform in different phonation types using the new IAIF-method

  • T.V. Ananthapadmanabha

    Acoustic analysis of voice source dynamics

  • B. Gold et al.

    Analysis of digital and analog formant synthesizers

    IEEE Trans. Audio Electroacoust.

    (1968)
  • M.J. Hunt et al.

    Interactive digital inverse filtering and its relation to linear prediction methods

There are more references available in the full text version of this article.

Cited by (435)

View all citing articles on Scopus
View full text