Zur Seitenansicht
 

Titelaufnahme

Titel
Event detection in musical audio : beyond simple feature design / submitted by Sebastian Böck
Weitere Titel
Musikalische Klangereigniserkennung jenseits einfacher Merkmale
VerfasserBöck, Sebastian
Begutachter / BegutachterinWidmer, Gerhard ; Peeters, Geoffroy
ErschienenLinz, 2016
Umfangxiii, 153 Seiten : Illustrationen
HochschulschriftUniversität Linz, Univ., Dissertation, 2016
Anmerkung
Zusammenfassung in deutscher Sprache
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers
SpracheEnglisch
Bibl. ReferenzOeBB
DokumenttypDissertation
Schlagwörter (DE)Musik / Audio / Signalverarbeitung / künstliche neuronale Netze / Beats / Downbeats / Metrum / Tempo / Transkription / Software
Schlagwörter (EN)music / audio / signal processing / artificial neural networks / beats / downbeats / meter / tempo / transcription / software
Schlagwörter (GND)Musik / Audiodatei / Signalverarbeitung / Neuronales Netz / Metrum
URNurn:nbn:at:at-ubl:1-12628 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist gemäß den "Hinweisen für BenützerInnen" verfügbar
Dateien
Event detection in musical audio [2.1 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Englisch)

This thesis is about the automatic detection and classification of sound events (e.g. notes or percussive sounds) in musical audio. It deals with four different sub-aspects, namely (i) the detection of the timing of these events (onset detection), (ii) their position inside the metrical grid (beat and downbeat tracking), (iii) the estimation of the dominant periodicity (tempo estimation), as well as (iv) identifying the frequency of the played notes (note onset transcription). Historically, beat tracking, tempo estimation, and note transcription systems were built upon onset detection algorithms. Most of them incorporated hand-crafted features, designed specifically for the given task, certain sounds or music styles. Unlike previous approaches, we avoid hand-crafted features almost entirely, but rather learn them directly from audio. We present several algorithms addressing the before mentioned tasks to detect and classify the sound events. All proposed methods perform state-of-the-art in their respective field over a wide range of sounds and music styles, and show the superiority of learned features both in regard to overall performance as well as generalisation capabilities. Reference implementations of the algorithms developed in this thesis are released as an open-source audio processing and music information retrieval (MIR) library written in Python. Additionally, we make the data used to develop and train the algorithms publicly available, stimulating further research and development in this area.

Zusammenfassung (Deutsch)

Ziel dieser Dissertation ist die automatische Erkennung und Klassifizierung von musikalischen Klangereignissen (z.B. Noten oder perkussiven Klängen). Dabei werden vier Aspekte genauer beleuchtet: (i) die genaue Erkennung der Anfangspositionen dieser Ereignisse, (ii) ob das Ereignis auf einem Beat (Taktschlag) innerhalb des Metrums oder - im Speziellen - auf dem ersten Schlag liegt, (iii) das daraus abzuleitende Tempo, und (iv) - mit Einschränkungen - die Tonhöhe des Klanges. Frühere System arbeiteten vor allem hierarchisch, d.h. zuerst werden die Anfangspositionen aller Klänge ermittelt und darauf basierend dann entschieden, ob es sich z.B. um Taktschläge handelt, oder mit welcher Tonhöhe ein Klang erklingt. Die meisten Systeme extrahieren dabei aus dem Signal von Hand definierte Merkmale, die oft nur für eine bestimme Musikrichtung oder spezielle Anwendung entworfen wurden und daher in ihrem Anwendungsbereich limitiert sind. Im Gegensatz dazu wird in den hier vorgestellten Algorithmen diese explizite Modellierung der Merkmale weitestgehend vermieden, indem stattdessen mittels maschinellen Lernalgorithmen relevante Merkmale direkt aus dem Musiksignal erlernt werden. Die hier vorgestellten Algorithmen sind in ihrem jeweiligen Bereich führend - unabhängig vom Musikstil. Zu sämtlichen Algorithmen werden Referenzimplementierungen in Form von freier Software zur Verfügung gestellt, gebündelt in einer einfach zu installierenden und erweiterbaren Softwarebibliothek. Darüber hinaus werden außerdem alle Daten die in dieser Dissertation verwendet wurden frei zugänglich zur Verfügung gestellt.