> Detailanzeige
Videm, Pavankumar
[Verfasser:in]
;
Backofen, Rolf
[Akademische:r Betreuer:in]
Albert-Ludwigs-Universität Freiburg Professur für Bioinformatik,
Albert-Ludwigs-Universität Freiburg Fakultät für Angewandte Wissenschaften
Analysis of high-throughput sequencing data related to small non-coding RNAs biogenesis and function
Teilen
Literatur-
verwaltung
Direktlink
Zur
Merkliste
Lösche von
Merkliste
Per Email teilen
Auf Twitter teilen
Auf Facebook teilen
Per Whatsapp teilen
- Medientyp: E-Book
- Titel: Analysis of high-throughput sequencing data related to small non-coding RNAs biogenesis and function
- Beteiligte: Videm, Pavankumar [Verfasser:in]; Backofen, Rolf [Akademische:r Betreuer:in]
- Körperschaft: Albert-Ludwigs-Universität Freiburg, Professur für Bioinformatik ; Albert-Ludwigs-Universität Freiburg, Fakultät für Angewandte Wissenschaften
-
Erschienen:
Freiburg: Universität, 2021
- Umfang: Online-Ressource
- Sprache: Englisch; Deutsch
- DOI: 10.6094/UNIFR/219816
- Identifikator:
- Schlagwörter: Life--Origin ; Non-coding RNA ; High throughput screening ; Small RNA ; miRNA ; RNA-RNA interaction ; (local)doctoralThesis
- Entstehung:
-
Hochschulschrift:
Dissertation, Universität Freiburg, 2021
-
Anmerkungen:
frei zugängliche neue Version unter IDN 1257077120
-
Beschreibung:
Abstract: Genes are the functional regions of DNA that are transcribed into RNA. RNA can either encode for proteins or is on itself a functional end-product. The RNAs that act as templates for protein biosynthesis are called protein-coding RNAs, whereas the remaining are called non-coding RNAs (ncRNAs). Surprisingly, the majority of transcribed RNA loci are actually non-coding, and only a minority encode proteins. Although they do not code for proteins, they play key roles in diverse cellular processes such as transcription, splicing, translation and gene regulation. Moreover, they are implicated in many diseases. This thesis focuses on the analysis of ncRNAs that are short in length, called small ncRNAs. The overall contributions in this thesis cover three research problems related to small ncRNAs: (i) annotation of functional small ncRNAs (ii) detection and analysis of small ncRNA interactions and (iii) improving the accessibility of computational tools used in small ncRNA research.<br><br>Conventionally, RNAs are annotated using sequence and structure conservation. This thesis proposes a computational method called BlockClust that uses neither the sequence nor the structure of ncRNAs but the processing patterns occurring in their biogenesis. The functions of ncRNAs are often closely associated with their biogenesis. The patterns in the processing of small ncRNAs can be observed by aligning the RNA sequencing data to the reference genome. BlockClust encodes these patterns into graphs and uses a graph kernel for clustering and classification. With quasi-linear time complexity of the graph kernel, BlockClust gained a 60-fold speedup, while improving the clustering and classification performance compared to other approaches. With a consistent performance over different organisms, a variety of tissues, and cell lines, BlockClust has proved to be a robust and bias-free approach.<br><br>There are two use-cases of the ncRNA interaction analysis that are presented in this<br>thesis. The first use-case analyzes the role of a microRNA family (miR200) in a neurological disorder. It involves differential gene expression analysis from RNA sequencing data of Forkhead box G1 (FOXG1) gene knockout and miR200 overexpression experiments. The study revealed an important pathway that causes Rett syndrome by FOXG1 knockout. The results indicate that FOXG1 affects the biogenesis of the miR200 family whose target is the protein kinase type II-beta regulatory subunit (PRKAR2B). As a result, miR200 upregulates PRKAR2B, which plays an important role in memory formation. The imbalance in its expression level may contribute to atypical Rett syndrome. The second use case offers a computational framework, ChiRA, for the analysis of genome-wide ncRNA interactions from RNA-RNA interactome experiments. These experiments generate chimeric sequences, each of which is a fusion of two interacting RNA sequences. Because of the short lengths, these sequences are often mapped to multiple reference locations, causing ambiguity in annotating the sequences. ChiRA deals with two important challenges in the data analysis, namely handling of multi-mapped sequences and accurately annotating them by quantification. It has been shown that ChiRA can identify the sequences that are multi-mapped to paralogous genes or gene families without requiring any information on gene relations. It is also an effective and sensitive approach that can detect new RNA-RNA interactions from published RNA-RNA interactome datasets.<br><br>The final objective of the thesis is to ensure the accessibility of the above-mentioned tools, analyses and long-term sustainability of small ncRNA research. RNA workbench, a Galaxy based framework for RNA-centric research was developed to achieve this goal. The RNA workbench comes in two flavors. A Docker-based RNA workbench can easily be deployed on a custom hardware infrastructure or even on a personal computer. A web-based alternative served on European Galaxy infrastructure has access to vast computational resources and is open to all users. The RNA workbench provides various workflows and hands-on tutorials for the analysis of small ncRNAs. Being part of the RNA workbench, all the computational tools and workflows developed during this thesis consequently feature long-term maintenance and support from the RNA community
Abstract: Gene sind die funktionellen Bereiche der DNA, die in RNA umgeschrieben werden. RNA kann entweder für Proteine kodieren oder kann als selbstständiges funktionelles Endpro- dukt fungieren. Die RNAs, die als Vorlage für die Proteinbiosynthese dienen, werden als proteinkodierende RNAs bezeichnet, während die übrigen als nicht-kodierende RNAs (ncR- NAs) bezeichnet werden. Überraschenderweise ist die Mehrheit der transkribierten RNA- Loci tatsächlich nicht-kodierend, und nur eine Minderheit ist Protein kodierend. Obwohl ncRNAs nicht für Proteine kodieren, spielen sie Schlüsselrollen in verschiedenen zellulären Prozessen wie Transkription, Spleißen, Translation und Genregulation. Außerdem spielen sie eine entscheidende Rolle in vielen Krankheiten. Diese Arbeit konzentriert sich auf die Analyse einer speziellen Art von ncRNAs, die aufgrund ihre Länge kleine ncRNAs genannt werden. Die vorliegende Arbeit befasst sich mit drei Forschungsschwerpunkten im Zusam- menhang mit kleinen ncRNAs: (i) Annotation von funktionalen kleinen ncRNAs, (ii) Detek- tion und Analyse von kleinen ncRNA-Interaktionen und (iii) Verbesserung der Zugänglichkeit von computergestützten Werkzeugen, die in der Erforschung von kleinen ncRNA verwendet werden. Konventionell werden RNAs anhand von Sequenz- und Strukturerhaltung annotiert. In dieser Arbeit wird eine Berechnungsmethode namens BlockClust vorgeschlagen, die weder die Sequenz noch die Struktur von ncRNAs verwendet, sondern die Verarbeitungsmuster, die bei ihrer Biogenese auftreten. Die Funktionen von ncRNAs sind oft eng mit ihrer Biogenese verbunden. Die Muster in der Prozessierung von kleinen ncRNAs können durch Alignments der RNA-Sequenzierungsdaten an das Referenzgenom beobachtet werden. BlockClust kodiert diese Muster in Graphen und verwendet einen Graph-Kernel für das Clustering und die Klas- sifikation der ncRNAs. Durch die quasi-lineare Zeitkomplexität des Graph-Kernels erreicht BlockClust eine 60-fach schnellere Laufzeit und verbesserte zudem das Clustering und die Klassifizierung der ncRNAs im Vergleich zu bestehenden Ansätzen. Mit einer konsistenten Leistung über verschiedene Organismen, eine Vielzahl von Geweben und Zelllinien hat sich BlockClust als ein robuster und bias-freier Ansatz erwiesen. Es gibt zwei Anwendungsfälle der ncRNA-Interaktionsanalyse, die in dieser Arbeit vorgestellt werden. Der erste Anwendungsfall befasst sich mit der Analyse einer microRNA-Familie (miR200 ) und deren Rolle in einer neurologischen Störung. Es handelt sich hierbei um eine differenzielle Genexpressionsanalyse von Forkhead Box G1 (FOXG1 ) Gen-Knockout- und miR200 -Überexpressions-Experimenten. Die Arbeit entdeckte einen wichtigen Signal- weg, der das Rett-Syndrom durch FOXG1 -Knockout verursacht. Die Ergebnisse zeigen, dass FOXG1 die Biogenese der miR200 -Familie beeinflusst, deren Ziel die regulatorische Untereinheit der Proteinkinase Typ II-beta (PRKAR2B) ist. Infolgedessen wird PRKAR2B durch miR200 hochreguliert, welches eine wichtige Rolle bei der Gedächtnisbildung spielt. Ein Expressionsungleichgewicht könnte zum atypischen Rett-Syndrom beitragen. Der zweite Anwendungsfall beschreibt ein computergestütztes Framework, ChiRA, für die Analyse von genomweiten ncRNA-Interaktionen aus RNA-RNA-Interaktomexperimenten. Diese Exper- imente erzeugen chimäre Sequenzen, die jeweils eine Fusion zweier interagierender RNA- Sequenzen darstellen. Aufgrund der kurzen Längen werden diese Sequenzen oft auf mehrere Referenzstellen gemappt, was zu Mehrdeutigkeit bei der Annotation der Sequenzen führt. ChiRA befasst sich mit zwei wichtigen Herausforderungen bei der Datenanalyse, nämlich dem Umgang mit mehrfach gemappten Sequenzen und deren genauer Annotation durch Quan- tifizierung. Es konnte gezeigt werden, dass ChiRA Sequenzen identifizieren kann, die gegen paraloge Gene oder Genfamilien mehrfach gemappt wurden, ohne dass Informationen über die Genbeziehungen erforderlich ist. ChiRA ist darüber hinaus ein effektiver und sensitiver Ansatz für die Identifizierung neuer RNA-RNA-Interaktionen aus bereits veröffentlichten RNA-RNA-Interaktomdatensätzen. Ein weiteres Ziel dieser Arbeit ist es, die Zugänglichkeit der oben genannten Werkzeuge und Analysen sowie die langfristige Nachhaltigkeit der Forschung an kleinen ncRNAs zu gewährleisten. Um dieses Ziel zu erreichen, wurde die RNA-Workbench, ein Galaxy-basiertes Framework zur computergestützten Erforschung von RNAs, entwickelt. Die RNA-Workbench gibt es in zwei Ausprägungen. Die Docker-basierte RNA-Workbench kann auf einer kunden- spezifischen Hardware-Infrastruktur oder auf einem Personal-Computer eingesetzt werden. Eine webbasierte Alternative, basierend auf dem europäischen Galaxy Server, stellt um- fangreiche Rechenressourcen für alle Benutzer zur Verfügung. Die RNA-Workbench bietet verschiedene Workflows und praktische Tutorials für die Analyse von kleinen ncRNAs an. Als Teil der RNA-Workbench werden alle in dieser Arbeit entwickelten Methoden und Workflows von der RNA-Community langfristig gepflegt und unterstützt - Zugangsstatus: Eingeschränkter Zugang | Informationen zu lizenzierten elektronischen Ressourcen der SLUB