Skip to Main content Skip to Navigation
Theses

Convolutional operators in the time-frequency domain

Résumé : Dans le cadre de la classification de sons,cette thèse construit des représentations du signal qui vérifient des propriétés d’invariance et de variabilité inter-classe. D’abord, nous étudions le scattering temps- fréquence, une représentation qui extrait des modulations spectrotemporelles à différentes échelles. Enclassification de sons urbains et environnementaux, nous obtenons de meilleurs résultats que les réseaux profonds à convolutions et les descripteurs à court terme. Ensuite, nous introduisons le scattering en spirale, une représentation qui combine des transformées en ondelettes selon le temps, selon les log-fréquences, et à travers les octaves. Le scattering en spirale suit la géométrie de la spirale de Shepard, qui fait un tour complet à chaque octave. Nous étudions les sons voisés avec un modèle source-filtre non stationnaire dans lequel la source et le filtre sont transposés au cours du temps, et montrons que le scattering en spirale sépare et linéarise ces transpositions. Le scattering en spirale améliore lesperformances de l’état de l’art en classification d’instruments de musique. Outre la classification de sons, le scattering temps-fréquence et le scattering en spirale peuvent être utilisés comme des descripteurspour la synthèse de textures audio. Contrairement au scattering temporel, le scattering temps-fréquence est capable de capturer la cohérence de motifs spectrotemporels en bioacoustique et en parole, jusqu’à une échelle d’intégration de 500 ms environ. À partir de ce cadre d’analyse-synthèse, une collaboration artscience avec le compositeur Florian Hecker
Document type :
Theses
Complete list of metadatas

Cited literature [246 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-01559667
Contributor : Abes Star :  Contact
Submitted on : Monday, July 10, 2017 - 6:06:05 PM
Last modification on : Tuesday, August 4, 2020 - 3:49:34 AM
Document(s) archivé(s) le : Wednesday, January 24, 2018 - 5:16:45 PM

File

LOSTANLEN_2017_diffusion.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-01559667, version 1

Citation

Vincent Lostanlen. Convolutional operators in the time-frequency domain. Signal and Image Processing. PSL Research University, 2017. English. ⟨NNT : 2017PSLEE012⟩. ⟨tel-01559667⟩

Share

Metrics

Record views

1289

Files downloads

2116