Recognition and retrieval tasks in large quasi-unannotated surgical video databases

Tong Yu

Thèse Année : 2021

Recognition and retrieval tasks in large quasi-unannotated surgical video databases

Reconnaissance et fouille dans une grande base de vidéos endoscopiques quasi-non annotée

(1)

Tong Yu

Fonction : Auteur
PersonId : 1198292
IdRef : 266118925

Laboratoire des sciences de l'ingénieur, de l'informatique et de l'imagerie

Résumé

Endoscopic video streams, as rich sources of information on the operating field, show great potential for exploitation by deep learning-based computer vision algorithms. Such algorithms can indeed serve as the foundation for context-aware surgery systems, capable of improving clinical outcomes by assisting surgeons during interventions. However this approach would require, under ordinary circumstances of full supervision, vast quantities of annotated recordings. While video data is abundant in endoscopy, annotations are highly scarce, which calls for alternative solutions using unannotated videos. We first propose a semi-supervised surgical phase recognition method, where an offline teacher model automatically labels data for a real-time model. We then move from recognition to video retrieval tasks, with self-supervised methods capable of continuously scanning large video databases for content visually matching a video live stream.

Les flux vidéos endoscopiques, riches en informations sur le site opératoire, ont un fort potentiel pour alimenter des algorithmes de vision fondés sur l’apprentissage profond. Ces algorithmes peuvent en effet opérer au sein de systèmes de chirurgie assistée par ordinateur, capables d’améliorer la qualité de vie des patients. Cependant, dans les conditions classiques de supervision complète, cette approche nécessiterait de vastes quantités de vidéos annotées. Or les annotations, contrairement aux vidéos elles-mêmes, sont rares, incitant ainsi à des méthodes utilisant des vidéos non-annotées. Nous proposons d’abord une méthode semi-supervisée de reconnaissance de phase, générant des annotations automatiques pour un modèle opérant en temps réel. Nous passons ensuite de la reconnaissance à la fouille de vidéos, avec des méthodes auto-supervisées recherchant en direct du contenu similaire à un flux vidéo au sein d’une grande base de données.

Mots clés

Deep learning Computer vision Retrieval Hashing Self-supervised learning Semi-supervised learning Endoscopy

Apprentissage profond Vision par ordinateur Fouille Hachage Apprentissage auto-supervisé Apprentissage semi-supervisé Endoscopie

Domaines

Bio-informatique [q-bio.QM]

Fichier principal

yu_tong_2021_269.pdf (29.96 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-03884631

Soumis le : lundi 5 décembre 2022-12:21:12

Dernière modification le : mercredi 17 avril 2024-03:48:18

Archivage à long terme le : lundi 6 mars 2023-18:35:40

Dates et versions

tel-03884631 , version 1 (05-12-2022)

Identifiants

HAL Id : tel-03884631 , version 1

Citer

Tong Yu. Recognition and retrieval tasks in large quasi-unannotated surgical video databases. Bioinformatics [q-bio.QM]. Université de Strasbourg, 2021. English. ⟨NNT : 2021STRAD051⟩. ⟨tel-03884631⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INSERM CNRS ENGEES STAR INSA-STRASBOURG INC-CNRS SITE-ALSACE INSA-GROUPE

91 Consultations

35 Téléchargements

Recognition and retrieval tasks in large quasi-unannotated surgical video databases

Reconnaissance et fouille dans une grande base de vidéos endoscopiques quasi-non annotée

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager