Zur Seitenansicht
 

Titelaufnahme

Titel
Metrical analysis of musical audio using probabilistic models / submitted by Florian Krebs
Weitere Titel
Metrische Analyse musikalischer Audiosignale mit proabilistischen Modellen
AutorInnenKrebs, Florian
Beurteiler / BeurteilerinWidmer, Gerhard ; Peeters, Geoffroy
ErschienenLinz, November 2016
Umfang140 Seiten : Illustrationen
HochschulschriftUniversität Linz, Dissertation, 2016
Anmerkung
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers
Zusammenfassung in deutscher Sprache
SpracheEnglisch
Bibl. ReferenzOeBB
DokumenttypDissertation
Schlagwörter (DE)Musik / Metrum / Rhythmus / Beat / Tempo / probabilistische Modelle / maschinelles Lernen / künstliche Intelligenz
Schlagwörter (EN)music / meter / rhythm / beat / tempo / downbeat / probabilistic models / machine learning / artificial intelligence
Schlagwörter (GND)Musik / Metrum / Stochastisches Modell / Maschinelles Lernen / Künstliche Intelligenz
URNurn:nbn:at:at-ubl:1-12826 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist gemäß den "Hinweisen für BenützerInnen" verfügbar
Dateien
Metrical analysis of musical audio using probabilistic models [9.66 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

In den letzten Jahren ist die Menge verfügbarer Musik explodiert. Um diese Datenmengen vernünftig organisieren und bearbeiten zu können, ist es essentiell, Methoden zu entwickeln die automatisch den Inhalt einer Mediendatei analysieren können. Diese Dissertation beschäftigt sich mit der automatischen Analyse des musikalischen Metrums, einer Hierarchie von Pulsen unterschiedlicher Frequenzen. Zu diesem Zweck präsentiere ich mehrere Systeme, die alle aus drei grundlegenden Komponenten bestehen: Die erste Komponente extrahiert Merkmale aus dem Audiosignal. Diese Merkmale werden dann von der zweiten Komponente, dem akustischen Modell, in Wahrscheinlichkeiten in der musikalischen Domäne übersetzt. Die dritte Komponente besteht aus einem probabilistischen Modell, das die Wahrscheinlichkeiten in eine Sequenz von semantischen Labels übersetzt. Diese Dissertation beschäftigt sich mit der zweiten und dritten Komponente, den akustischen und probabilistischen Modellen. Ich teste verschiedene Methoden des maschinellen Lernens auf ihre Eignung als akustisches Modell und entwickle Algorithmen die es erlauben effiziente Inferenz mit probabilistischen Modellen durchzuführen. Die beschriebenen Systeme werden dann in einen Schlagzeugroboter integriert, der selbstständig den Rhythmus eines Musikstückes analysieren und somit einen Musiker auf dem Schlagzeug begleiten kann. Die präsentierten Methoden gehören zum aktuellen Stand der Technik im Bereich der automatischen metrischen Analyse von Musik. Die dargelegten Ergebnisse unterstreichen die Überlegenheit von maschinell gelernten Systemen gegenüber Systemen die hauptsächlich aus manuell gesetzten Regeln bestehen. Sowohl die entwickelten Algorithmen, als auch die im Laufe der Dissertation entstandenen Annotationen werden öffentlich zugänglich gemacht.

Zusammenfassung (Englisch)

Due to the exploding amount of available music in recent years, media collections cannot be managed manually any more, which makes automatic audio analysis crucial for content-based search, organisation, and processing of data. This thesis focuses on the automatic extraction of a metrical grid, determined by beats, downbeats, and time signature, from a music piece. I propose several algorithms to tackle this problem, all comprising three stages: First, (low-level) features are extracted from the audio signal. Second, an acoustic model transfers these features into probabilities in the music domain. Third, a probabilistic sequence model finds the most probable sequence of labels under the model assumptions. This thesis provides contributions to the second and third stage. I (i) explore acoustic models based on machine learning methods, and (ii) develop models and algorithms for efficient probabilistic inference for both online and offline scenarios. Further, I design applications such as an automatic drummer which listens to and accompanies a musician in a live setting. The most recent algorithms developed in this thesis exhibit state-of-the-art performance and clearly demonstrate the superiority of systems incorporating machine learning over hand-designed systems, which were prevalent at the time of starting this thesis. All algorithms developed in this thesis are publicly available as open-source software. I also publish beat and downbeat annotations for the Ballroom dataset to foster further research in this area.

Statistik
Das PDF-Dokument wurde 77 mal heruntergeladen.