Recognition and retrieval tasks in large quasi-unannotated surgical video databases ; Reconnaissance et fouille dans une grande base de vidéos endoscopiques quasi-non annotée

Media type: E-Book; Electronic Thesis; Text

Title: Recognition and retrieval tasks in large quasi-unannotated surgical video databases ; Reconnaissance et fouille dans une grande base de vidéos endoscopiques quasi-non annotée

Contributor: Yu, Tong [Author]

imprint: theses.fr, 2021-12-09

Language: English

Keywords: Endoscopy ; Hashing ; Retrieval ; Hachage ; Fouille ; Apprentissage profond ; Vision par ordinateur ; Deep learning ; Semi-supervised learning ; Endoscopie ; Computer vision ; Self-supervised learning ; Apprentissage auto-supervisé ; Apprentissage semi-supervisé

Origination:

Footnote: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.

Description: Les flux vidéos endoscopiques, riches en informations sur le site opératoire, ont un fort potentiel pour alimenter des algorithmes de vision fondés sur l’apprentissage profond. Ces algorithmes peuvent en effet opérer au sein de systèmes de chirurgie assistée par ordinateur, capables d’améliorer la qualité de vie des patients. Cependant, dans les conditions classiques de supervision complète, cette approche nécessiterait de vastes quantités de vidéos annotées. Or les annotations, contrairement aux vidéos elles-mêmes, sont rares, incitant ainsi à des méthodes utilisant des vidéos non-annotées. Nous proposons d’abord une méthode semi-supervisée de reconnaissance de phase, générant des annotations automatiques pour un modèle opérant en temps réel. Nous passons ensuite de la reconnaissance à la fouille de vidéos, avec des méthodes auto-supervisées recherchant en direct du contenu similaire à un flux vidéo au sein d’une grande base de données. ; Endoscopic video streams, as rich sources of information on the operating field, show great potential for exploitation by deep learning-based computer vision algorithms. Such algorithms can indeed serve as the foundation for context-aware surgery systems, capable of improving clinical outcomes by assisting surgeons during interventions. However this approach would require, under ordinary circumstances of full supervision, vast quantities of annotated recordings. While video data is abundant in endoscopy, annotations are highly scarce, which calls for alternative solutions using unannotated videos. We first propose a semi-supervised surgical phase recognition method, where an offline teacher model automatically labels data for a real-time model. We then move from recognition to video retrieval tasks, with self-supervised methods capable of continuously scanning large video databases for content visually matching a video live stream.

Access State: Open Access

Search in field:

Recently searched for: