1. Zeichnen Sie ein Blockdiagramm (ca. 4-6 Blöcke), das die Schritte bei der Umwandlung eines analogen Audiosignals in sein Magnitudenspektrogramm darstellt.

analoges Audiosignal abtansten Windowing DTFT Spektrogramme

  1. Betrachten Sie das folgende akustische Sprachsignal. Welche Eigenschaften der menschlichen Sprache können Sie in dieser Wellenform erkennen, und welche Teile können Sie nicht direkt identifizieren? Ist die Wellenform geeignet, um Phone und ihre Eigenschaften zu identifizieren?

Erkennen:

  • Pausen
  • Lautstärke
  • Hintergrund Geräusche

Erkennt nicht

  • Wortgrenzen

  1. Was ist der Unterschied zwischen dem obigen Sprachsignal und dem folgenden Sprachsignal? Bitte geben Sie eine Erklärung, welche Art von gesprochener Sprache in den Diagrammen der Fragen (2) und (3) dargestellt sein könnte.

A: normale Sprache
B: zwischen jedem Wort oder Laut wurde eine klare Pause gemacht

  1. Betrachten Sie das folgende Spektrogramm eines einzelnen Wortes. Die einzelnen Laute des Wortes sind im Spektrogramm bereits vorsegmentiert. Bitte erklären Sie, um welche Art von Laut es sich handelt (z. B. Plosiv, Frikativ, Vokal usw.). Sie müssen nicht angeben, welcher konkrete Laut es ist.

Frikativ ist die Frequenz höher, da durch das Pressen der Laute zwischen Zähnen und Lippen viele Wirbel entstehen

Im Gegensatz dazu: Vokale können sehr ungehindert rauskommen