WWW.ABSTRACT.XLIBX.INFO
FREE ELECTRONIC LIBRARY - Abstract, dissertation, book
 
<< HOME
CONTACTS



Pages:   || 2 | 3 | 4 | 5 |   ...   | 18 |

«Dissertation zur Erlangung des Grades des Doktors der Naturwissenschaften der Naturwissenschaftlich-Technischen Fakultät III Chemie, Pharmazie, Bio- ...»

-- [ Page 1 ] --

Computational Analysis of

Protein-Protein Interactions

Dissertation

zur Erlangung des Grades

des Doktors der Naturwissenschaften

der Naturwissenschaftlich-Technischen Fakultät III

Chemie, Pharmazie, Bio- und Werkstoffwissenschaften

der Universität des Saarlandes

von

Diplom-Biologe

Sam Ansari

Saarbrücken 2007

Tag des Kolloquiums: 13. Juni 2007

Dekan: Prof. Dr. Uli Müller

Vorsitzender: Prof. Dr. Jörn Walter

Berichterstatter: Prof. Dr. Volkhard Helms Prof. Dr. Hans-Peter Lenhof Beisitzender: Dr. Michael Hutter Protokollantin: M. Sc. Susanne Eyrisch Eidesstattliche Erklärung Hiermit versichere ich an Eides Statt, dass ich die vorliegende Arbeit selbständig und ohne Benutzung anderer als der angegebenen Hilfsmittel angefertigt habe. Die aus anderen Quellen oder indirekt übernommenen Daten und Konzepte sind unter Angabe der Quelle gekennzeichent.

Die Arbeit wurde bisher weder im In- noch im Ausland in gleicher oder ähnlicher Form in einem Verfahren zur Erlangung eines akademischen Grades vorgelegt.

Saarbrücken, Juni 2007 Sam Ansari Die vorliegende Arbeit entstand in der Zeit von Februar 2003 bis Dezember 2006 am Zentrum für Bioinformatik an der Universität des Saarlandes unter Leitung von Herrn Prof. Dr. Volkhard Helms.

Zusammenfassung:

Jüngste Forschungsergebnisse der letzten Jahre unterstreichen, dass Protein-Protein Interaktionen eine wichtige Rolle für die biologischen Abläufe im intra- und extrazellulären Raum spielen. Aufgrund der teilweise widersprüchlichen und unvollständigen Erkenntnisse über Protein-Protein Interaktionen, befasst sich die Arbeit mit diesem aktuellen Thema.

In der Arbeit wird zunächst eine große Zahl von temporär wechselwirkenden Proteinkomplexen mit bekannter Struktur gesammelt und analysiert. Dabei werden unter anderem Aspekte wie Vorkommen und Paarungspräferenzen der Aminosäuren und Sekundärstrukturelemente ermittelt, für die in früheren Untersuchungen bereits einige charakteristische Merkmale gefunden wurden. Die Ergebnisse dieses Kapitels stehen im Einklang mit früheren Studien und zeigen, dass temporär wechselwirkende Proteinkomplexe zwecks Reversibilität der Interaktion einen höheren Anteil an hydrophilen Aminosäuren besitzen und eine hohe geometrisch komplementäre Schnittstellenregion aufweisen.

Diese charakteristischen Merkmale werden in einem weiteren Ansatz auf ihre Vorhersagekraft untersucht. Dazu wird die Effizienz von Protein-Protein Dockingprogrammen unter Berücksichtigung dieser Merkmale ausgewertet.

Eine bekannte Schwäche von Protein-Protein Dockingprogrammen besteht darin, dass die nativen Protein-Protein Komplexe allein über die geometrische Komplementarität an der Schnittstellenregion ermittelt werden. Frühere Studien haben gezeigt, dass diese Vereinfachung in vielen Fällen zu einer großen Zahl von falsch-positiven Ergebnissen führt. Mit der Kenntnis über Paarungspräferenzen von Aminosäuren und Sekundärstrukturelementen werden die Ausgaben des Dockingprogramms nun neu analysiert. Tatsächlich zeigen die Ergebnisse leichte Verbesserungen. Eine detaillierte Analyse der Resultate zeigt allerdings, dass die verwendeten Merkmale zu keiner klaren Erkennung von falsch-positiven Dockingergebnissen führen. Um spezifischere Merkmale zur Erkennung von temporär wechselwirkenden Proteinkomplexen ausfindig zu machen, werden anschließend temporär und permanent wechselwirkende Proteinkomplexe miteinander verglichen. Damit werden die Unterschiede dieser beiden Proteinkomplextypen verdeutlicht und eine spezifische Merkmalsanalyse erleichtert. Auf Basis eines neuen Datensatzes ergeben sich für Paarungspräferenzen der Aminosäuren und Sekundärstrukturelemente keine klaren Unterscheidungen. Diese Beobachtung lässt sich zum Teil auf den geringen Datensatz zurückführen, was daraufhin zu einer ausgedehnten Datensuche und Datenbank-Konstruktion führt. Eine umfangreiche Literaturrecherche ergab 268 temporär und 266 permanent wechselwirkende Proteinkomplexe. Die für diesen Zweck entwickelte MySQL Datenbank erlaubt eine schnelle und spezifische Auswahl von Proteinkomplexen sowie die Berechnung von unterschiedlichen Potentialen, die z.B. in Dockingprogrammen eingesetzt werden können. Weiterhin lassen sich viele zusätzliche Merkmale der Proteinkomplexe zusammenstellen und ausgeben. Mit dieser großen und schnell zugänglichen Datenmenge wird das Problem der klaren Unterscheidung von temporär und permanent wechselwirkenden Proteinkomplexen wieder aufgegriffen. Der Einsatz eines automatisierten Mustererkennungs-Programms und die Analyse von 10.038 Merkmalen oder 347 Merkmalsgruppen anhand von 534 Proteinkomplexen ergab schließlich eine hohe Genauigkeit der Unterscheidung von temporär und permanent wechselwirkenden Proteinkomplexen. Diese Genauigkeit wird durch die gewichtete Kombination von lediglich vier minderdimensionale Merkmalsgruppen erreicht. Mit dieser hohen Wiedererkennung von temporär wechselwirkenden Proteinkomplexen sollte die Effizienz von Protein-Protein Dockingprogrammen, die bei der Evaluation der Dockinganordnungen allein auf geometrische Schnittstellenkomplementarität beruhen, deutlich erhöht werden. Weiterhin erlaubt die hohe Wiedererkennung der beiden Proteinkomplextypen, neue Daten aus der RCSB PDB automatisch zu klassifizieren, und in der Datenbank abzulegen. Eine größere Datenmenge wird die statistische Aussagekraft der Analysen deutlich erhöhen und eine feinere Aufteilung der Komplextypen erlauben.





Kurzbeschreibung:

Protein-Protein Interaktionen haben in den letzten Jahren sowohl im Bereich der Pharmazie, Medizin, Biologie, als auch im Bereich der Bioinformatik großes Interesse erlangt. In dieser Arbeit werden statistische Daten zu transienten Protein-Protein Interaktionen gesammelt und ausgewertet. Charakteristische Mermale werden in einem weiteren Ansatz auf ihre Vorhersagekraft untersucht. Dazu werden die Ergebnisse aus einem Docking-Programm nach diesen Merkmalen bewertet um natürliche Komplexe von solchen, die lediglich eine hohe geometrische Komplementarität aufweisen, zu unterscheiden. Die Ergebnisse zeigen Verbesserungen, aber dennoch Schwächen in der Vorhersagekraft auf. Um noch spezifischere Merkmale ausfindig zu machen, werden transiente und permanente Komplexe gegeneinander verglichen. Der eingeschränkte Datensatz führt schließlich zu einer ausgedehnten Datensuche und DatenbankKonstruktion. Diese wird schlussendlich für eine sehr detaillierte Merkmalsanalyse verwendet, die ein automatisiertes Mustererkennungs-Programm verwendet. Mit Hilfe dieses Programmes können sogar Kombinationen von Merkmalen auf ihre Spezifität untersucht werden, die schliesslich zu einer hohen Genauigkeit der Unterscheidung von transienten und permanenten Protein-Protein Interaktionen führt. Eine Kombination von vier Merkmalsgruppen ist dabei ausreichend. Damit können nun Docking-Programme verbessert werden, die zum Zwecke der Rechenzeitreduktion die Auswertung der Komplex-Anordnungen nur auf geometrische Komplementarität beziehen.

Abstract:

In the past years protein-protein interactions have gained a lot of interest in the fields of pharmacy, medicine, biology, and bioinformatics. In this work, statistical information on transient protein-protein interactions are collected and analyzed. Characteristic properties are then evaluated and their predictability estimated. Therefore, the results from a common docking approach are re-evaluated with the collected information to discriminate the native structure from those that simply have a high geometric complementarity at the interface region. The results show that although there is a noticeable improvement of the predictability after applying statistical information, the overall accuracy is still low. To find other more specific properties, transient and permanent complexes were compared to each other. The lack of data leads to an extensive search for more suitable structural data and the development of an extensive database. This database was ultimately used to retrieve a large number of protein properties that were automatically analyzed for their separation precision. A high accuracy was obtained in separating transient and permanent interactions based on the combination of only four properties. Combining this information with common docking approaches based on geometrical complementarity may lead to satisfying sensitivities.

Contents

Organization of the Thesis

1. Introduction

1.1. Protein-Protein Interactions

The Interaction of Proteins

1.1.1.

The Role of Protein Dimerization and Oligomerization in Biological Cells

1.1.2.

The Diversity of Protein-Protein Interactions

1.1.3.

Known Properties of Protein-Protein Interactions

1.1.4.

1.2. Methods in Bioinformatics

Databases

1.2.1.

–  –  –

EMBL (Release)

1.2.1.1.1.

UniProtKB/SWISSProt

1.2.1.1.2.

COG

1.2.1.1.3.

Structural Databases

1.2.1.2.

RCSB PDB

1.2.1.2.1.

CATH and SCOP

1.2.1.2.2.

Molecular Evolution

1.2.2.

Sequence Analyses

1.2.3.

Pairwise Protein Alignments

1.2.3.1.

Multiple Sequence Alignments

1.2.3.2.

Consurf

1.2.3.3.

Structural Analyses

1.2.4.

VMD

1.2.4.1.

Interface Definition

1.2.4.2.

Protein-Protein Docking

1.2.4.3.

–  –  –

1.2.5. Data Mining Clustering

1.2.5.1.

Classification

1.2.5.2.

2. Statistical Analysis of Transient Protein-Protein Interfaces

2.1. Overview

Analysis of Protein Interfaces

2.1.1.

Packing of Interfaces

2.1.2.

Transient Binding

2.1.3.

Different Interface Sizes

2.1.4.

2.2. Methods

Collecting Transient Protein-Protein Complexes

2.2.1.

Automated Analysis

2.2.2.

Normalization

2.2.3.

2.3. Results and Discussion

Residue Composition at Interfaces

2.3.1.

Residue Pairing Propensity at Interfaces

2.3.2.

Secondary Structure Element-Composition

2.3.3.

–  –  –

Comparison of Three Different Interface Sizes

2.3.6.

2.4. Conclusion and Outlook

3. Enhanced Sensitivity of a Docking Approach

3.1. Overview

The Rigid-Body Docking Problem

3.1.1.

3.2. Methods

BDOCK

3.2.1.

Docking Scoring-Function

3.2.2.

RPScore

3.2.2.1.

SARScore

3.2.2.2.

ii Implementation of the Pair Potentials in BDOCK

3.2.2.3.

Benchmark

3.2.3.

3.3. Results and Discussion

Unbound-Unbound vs. Bound-Bound Docking

3.3.1.

BDOCK Sensitivity without Scoring Functions

3.3.2.

BDOCK and SARScore(res)

3.3.3.

Comparing RPScore and SARScore(res)

3.3.4.

–  –  –

Critical Assessment of the Results

3.3.6.

Analysis of the Distance Criteria

3.3.7.

Analysis of the Benchmark Set

3.3.8.

Analysis of the Dataset

3.3.9.

3.4. Conclusion and Outlook

4. Distinction of Obligate and Non-obligate Interactions

4.1. Overview

Introduction

4.1.1.

4.2. Methods

Data Handling

4.2.1.

Distance Matrix

4.2.2.

Significance Assessment

4.2.3.

4.3. Results

Evaluating the Clusters for given Properties

4.3.1.

Evaluating the Clustering Algorithms

4.3.2.

4.4. Conclusion and Outlook

5. A Database for Analyzing Biomolecular Contacts

5.1. Overview

Introduction

5.1.1.

5.2. Structure

Data Set

5.2.1.

–  –  –

Additional Data

5.2.1.2.

Database Design

5.2.2.

Database Administration

5.2.3.

5.3. Features

Query Options

5.3.1.

Data View

5.3.2.

Output Options

5.3.3.

5.4. Outlook

6. Classification of Obligate and Non-obligate Complexes

6.1. Overview

6.2. Methods

Dataset

6.2.1.

Construction of the Training and Test Set

6.2.2.

Interface Criteria

6.2.2.1.

Fraction Methods

6.2.2.2.

Amino Acid-Classes

6.2.2.3.

Feature Collection

6.2.2.4.

6.3. Results

Single Feature Vectors

6.3.1.

Combined Feature Vectors

6.3.2.

6.4. Discussion

7. Outlook

Literature

Acknowledgements

ivvvi Organization of the Thesis

Chapter 1 gives a short introduction to protein-protein interactions. Starting with the principles of dimerization and oligomerization and their consequences in biological cells will lead us to the current view of protein-protein interactions. Furthermore, this chapter introduces a number of methods and concepts that were employed and presumed in this thesis.

Chapter 2 presents a statistical approach based on non-redundant transient protein-protein interfaces of known structure. By combining many known aspects of proteinprotein interactions, deeper insight in their nature was obtained.

Chapter 3 is based on chapter 2 and presents an application of its observations. Using a rigid-body docking approach, the sensitivity of the docking is intensely tested after applying residue and structure based potentials.

Chapter 4 focuses on the specificity of interface properties for transient protein-protein interfaces. Comparing a number of interface properties from transient protein-protein complexes to permanent protein-protein complexes will reveal the specificity of the given interface properties. This was observed by assessing the separation quality of the tested interface properties into transient and permanent protein-protein interactions.



Pages:   || 2 | 3 | 4 | 5 |   ...   | 18 |


Similar works:

«Neue Funktionen in 3.1 Handbuch: C. Bachmann, H. Bischoff, S. Pfeifer, C. Schomburg Die in diesem Dokument enthaltenen Informationen können ohne Vorankündigung geändert werden und stellen keine Verpflichtung seitens der Steinberg Media Technologies GmbH dar. Die Software, die in diesem Dokument beschrieben ist, wird unter einer Lizenzvereinbarung zur Verfügung gestellt und darf ausschließlich nach Maßgabe der Bedingungen der Vereinbarung (Sicherheitskopie) kopiert werden. Ohne...»

«Стиву, Эллен и Чарли Я люблю вас всем сердцем Brene Brown THE GIFTS OF IMPERFECTION Let Go of Who Think You’re Supposed to Be and Embrance Who You Are HAZELDEN Брене Браун ДАРЫ НЕСОВЕРШЕНСТВА Как полюбить себя таким, какой ты есть Перевод с английского Москва УДК 159.923.2 ББК 88.351.2 Б87 Переводчик Анастасия Иванякова Редактор...»

«ELHAM Elham has some casualties commemorated in the Church (St Mary) that are not found on the civic war memorial located at the northern end of the High Street, and vice versa, unfortunately several men appear to have been commemorated by different Christian names, sadly as with other memorials, several men have been omitted from both memorials. AMES E.T (brother) Private G/18403 Ernest Thomas AMES. 11th Battalion, Queen’s Own (Royal West Kent Regiment). Formerly 2642 Royal East Kent Mounted...»

«Omark Industries ammunition factory in Lewiston, Idaho, with empty rounds of.22 calibre ammunition on the production line, 1967. 46Alan Band/Fox Photos/Getty Images © Targeting Ammunition The Production of Ammunition for Small Arms and Light Weapons Holger Anders and Reinhilde Weidacher Introduction The availability of ammunition for the small arms and light weapons used by armed groups and criminals is a crucial determinant of the ability of these actors to use lethal force. The control of...»

«1 / 2000 http://www.lectio.unibe.ch Esther A. de Boer Mary Magdalene and the Disciple Jesus Loved1 -Abstract / Résumé / Zusammenfassung Die Identität des Johanneischen anonymen Jüngers, den Jesus liebte, ist immer noch rätselhaft. Viele Lösungen sind vorgeschlagen worden, aber keine hat eine generelle Übereinstimmung zur Folge gehabt. Unter anderem sind die Namen verschiedener Männer als mögliche Identifizierungen des anonymen Jüngers genannt worden. Zu diesen Vorschlägen hat R. K....»

«Studie im Auftrag von Interpharma Gesundheitsausgaben und Krankheitskosten Polynomics Dr. Harry Telser, Barbara Fischer, Dr. Karolin Leukert, Dr. Stephan Vaterlaus Impressum Herausgeber: Interpharma, Verband der forschenden pharmazeutischen Firmen der Schweiz, Basel © Interpharma /Polynomics, September 2011 Bezug: Interpharma Petersgraben 35, Postfach CH-4003 Basel E-Mail: info@interpharma.ch Website: www.interpharma.ch Gestaltung: Continue AG, Basel Druck: Effingerhof, Brugg...»

«RESUME ANIL R. CHOURASIA Professor Department of Physics Texas A & M University Commerce Commerce, Texas, 75429. Phone: (903) 886-5485 Fax: (903) 886-5480 e-mail: Anil.Chourasia@tamuc.edu EDUCATION Ph.D. (Physics) Nagpur University, Nagpur, India (1986) Dissertation title : X-ray Spectroscopic Investigation of some compounds of Germanium and Arsenic. M.Sc. (Physics) Nagpur University, Nagpur, India (1978) B.Sc. (Physics, Mathematics, Chemistry) Nagpur University, Nagpur, India (1975) EXPERIENCE...»

«REPRESENTATIONS OF GOTHIC CHILDREN IN CONTEMPORARY IRISH LITERATURE: A SEARCH FOR IDENTITY IN PATRICK MCCABE’S THE BUTCHER BOY, SEAMUS DEANE’S READING IN THE DARK, AND ANNA BURNS’ NO BONES by KELLY RATTE A thesis submitted in partial fulfillment of the requirements for the Honors in the Major Program in English Literature in the College of Arts and Humanities and in The Burnett Honors College at the University of Central Florida Orlando, Florida Spring Term 2013 Thesis Chair: Dr. James...»

«SCHOOL OF EARTH AND SPACE EXPLORATION, ARIZONA STATE UNIVERSITY ! P.O. BOX 876004 ! TEMPE, AZ 85287-6004 ! PHONE: 1 (970) 901–3580 ! E-MAIL: CAMERON.M.MERCER@ASU.EDU CAMERON M. MERCER EDUCATION 2011–Present Arizona State University, Tempe AZ School of Earth and Space Exploration Ph.D. Candidate — GPA: 4.0 Summer 2011 Fort Lewis College, Durango CO Geology Field Camp — GPA: 4.0 2007–2011 Middlebury College, Middlebury VT B.A. Physics and Geology — GPA: 3.61 Magna Cum Laude, High...»

«Publikationen Martin Jansen Seite 1 M. Jansen, R. Hoppe: 1. Neue Oxocobaltate Naturwissenschaften 59 (1972) 215-216 M. Jansen, R. Hoppe: 2. Zur Kenntnis der NaCl-Strukturfamilie: Neue Untersuchungen an Li2MnO3 Z. Anorg. Allg. Chem. 397 (1973) 279 – 289 M. Jansen, R. Hoppe: 3. Zur Kenntnis von Li8CoO6 Z. Anorg. Allg. Chem. 398 (1973) 54 – 62 M. Jansen, R. Hoppe: 4. Zur Kenntnis der NaCl-Strukturfamilie: Die Kristallstruktur von NaMnO2 Z. Anorg. Allg. Chem. 399 (1973) 163 – 169 M. Jansen:...»

«53-1003861-01 20 July 2015 Brocade Virtual Traffic Manager: Cloud Services Installation and Getting Started Guide Supporting 10.1 Copyright © 2015 Brocade Communications Systems, Inc. All Rights Reserved. ADX, Brocade, Brocade Assurance, the B-wing symbol, DCX, Fabric OS, HyperEdge, ICX, MLX, MyBrocade, OpenScript, The Effortless Network, VCS, VDX, Vplane, and Vyatta are registered trademarks, and Fabric Vision and vADX are trademarks of Brocade Communications Systems, Inc., in the United...»

«Competencies and Skills: Filling Old Skins with New Wine Christina D¨rge o To cite this version: Christina D¨rge. Competencies and Skills: Filling Old Skins with New Wine. Nicholas o Reynolds; M´rta Turcs´nyi-Szab´. Key Competencies in the Knowledge Society, 324, Springer, a a o pp.78-89, 2010, IFIP Advances in Information and Communication Technology, 978-3-642hal-01054672 HAL Id: hal-01054672 https://hal.inria.fr/hal-01054672 Submitted on 8 Aug 2014 HAL is a multi-disciplinary open...»





 
<<  HOME   |    CONTACTS
2016 www.abstract.xlibx.info - Free e-library - Abstract, dissertation, book

Materials of this site are available for review, all rights belong to their respective owners.
If you do not agree with the fact that your material is placed on this site, please, email us, we will within 1-2 business days delete him.