protein structure, protein evolution, protein folding, molecular dynamics, simulation
Discipline
Bioinformatics (Council of Medical and Biological Sciences)
70 %
Analysis, modelling and simulation of biological systems (Council of Medical and Biological Sciences)
30 %
Ortelius classification: Evolutionary biology
Panel
Genetics, Genomics, Bioinformatics and Systems Biology
Department or equivalent
Institute of Enzymology, BRC, Hungarian Academy of Sciences
Starting date
2008-04-01
Closing date
2011-04-30
Funding (in million HUF)
22.221
FTE (full time equivalent)
2.39
state
closed project
Summary in Hungarian
A fehérjemolekulákat kb. 1000 szerkezeti osztályba, ''fold''-ba lehet sorolni. Egy ''fold'' másodlagos szerkezeti elemek meghatározott módon elrendezett halmazából áll. Bár a szekvenciák szintjén már sokat tudunk a fehérjék evolúciójáról, még mindig rejtélynek számít az, hogy hogyan keletkeztek a foldok.
Bioinformatikai megközelítések, fehérjetervezés, molekuláris szimulációk és kísérletek kombinációjával tervezünk betekintést nyerni azokba az ősi evolúciós folyamatokba, amelyek a fehérjeszerkezetek ma tapasztalható sokféleségét eredményezték. Az egyik hipotézis az, hogy a hosszabb láncok rövidebb peptidszegmensek fúziója révén keletkeztek. Azonban számos kérdés nyitott marad. Az ősi peptidvilágban képesek voltak-e a rövid peptidek arra, hogy stabil szerkezetet képezzenek? Képesek voltak-e asszociálódni, a jelenkori doménekhez hasonló oligomereket képezve? Mi volt a funkciójuk monomerként?
Olyan rövid peptideket tervezünk és találunk, amelyek bonyolultabb folddá képesek asszociálódni. Számítógéppel újratervezzük egyes ismert foldok szekvenciáját, és Monte Carlo, valamint diszkrét molekuladinamikai szimulációkkal megjósoljuk a megtervezett peptidek felgombolyodási és asszociációs viselkedését. A legígéretesebb szekvenciák viselkedését kísérleti úton is teszteljük.
Az eredmények várhatóan elvezetnek egy szimulációkkal és kísérletekkel alátámasztott, valószínű evolúciós forgatókönyvhöz a fehérjefoldok eredetéről. Ezen felül új fehérjetervezési stratégiák kifejlesztése is várható.
Summary
Protein molecules can be classified into ~1000 distinct structural classes called ''folds''. A ''fold'' consists of secondary structural elements arranged and connected in a specific way. Although we know a great deal about protein evolution at the sequence level, how new folds arise is still a mystery.
We plan to use a combination of bioinformatics approaches, protein design, molecular simulations and experiments to gain insight into the ancient evolutionary events that gave rise to the current diversity of protein structures. A viable hypotheses is that longer chains are the results of fusion events merging shorter peptide segments. But a number of questions remain open. In the ancient peptide world, were these short peptides able to form a stable structure themselves? Were they able to associate to form oligomers that were similar to present-day domains? What was their function as monomers?
Our research plan involves designing and finding short peptides that can associate to a more complex fold. We computationally redesign sequences of known folds and employ Monte Carlo and discrete molecular dynamics simulations to predict the folding and association behavior of the designed peptides. Finally, the most promising sequences will be experimentally tested.
We expect that the results will lead to a plausible evolutionary scenario, supported by simulations and experiments, for the origin of protein folds. They will also provide new strategies for efficient protein design.
Final report
Results in Hungarian
A kutatás fő eredménye, hogy azonosítottuk a fehérjék egy új, eddig le nem írt, nem vizsgált csoportját, mely mind evolúciós, mind funkcionális szempontból fontos sajátságokkal rendelkezik. Ezeket szegmenscserélt fehérjéknek neveztük el. Olyan többdoménes fehérjékről van szó, melyek doménjei szerkezetileg hasonlóak és köztük egymással ekvivalens fehérjerészek ki vannak cserélve. Ez hasonló a már ismert "3D doméncsere" jelenségéhez, ám míg ott a csere láncok között történik, itt láncon belül. Az ismert szerkezetű fehérjék között 18 szegmenscserélt fehérjecsaládot azonosítottunk. Felállítottunk két evolúciós modellt a szegmenscserélt fehérjék kialakulásának leírására: a "doméncsere és fúzió", valamint a "cirkuláris permutáció" modelljét. Különféle tesztek segítségével bebizonyítottuk, hogy a szegmenscserélt fehérjék többsége valószínűleg a "doméncsere és fúzió" mechanizmus útján jött létre. Ez egyben a többdoménes architektúrák keletkezésének egyik fontos, új mechanizmusa. A szegmenscserélt fehérjék funkcionális tulajdonságait megvizsgálva megállapítottuk, hogy ezek körében gyakori a csuklószerű doménmozgás, melyet feltevésünk szerint elősegít a szegmenscsere által létrehozott két összekötő szakasz. Ily módon a szegmenscserének funkcionális jelentősége is van. Egyszerűsített fehérjemodellek segítségével megállapítottuk, hogy a fehérjeméret növelésének rendezettséget elősegítő szerepe van, ami részben magyarázza a fehérjék méretnövekedését az evolúció során.
Results in English
The main result of the project is the identification of a new, previously undescribed group of proteins that has important evolutionary and functional properties. We call them segment-swapped proteins. They are multidomain proteins with structurally similar domains, with equivalent portions swapped between them. This is similar to the well-known "3D domain swapping" phenomenon but here the swap occurs within a chain rather than between chains. We identified 18 segment-swapped protein families among proteins with known structures. We posited two evolutionary models to explain the formation of segment-swapped proteins: "domain swapping and fusion" and "circular permutation". Using a variety of tests, we proved that the majority of segment-swapped proteins likely arose by the "domain swapping and fusion" mechanism. This is also an important new mechanism for generating new multidomain architectures. Studying the functional properties of segment-swapped proteins, we found that many of them exhibit hinge-bending domain motions, and we propose that this is facilitated by the two linker regions resulting from the segment swapping. Thus, segment swapping has functional implications. Using simplified protein models, we found that increasing protein size promotes structural ordering, which in part explains why protein size tends to increase during evolution.
Szilágyi A: A mathematically related singularity and the maximum size of protein domains, Proteins, 2008
Szilágyi A, Györffy D, Závodszky P: The twilight zone between protein order and disorder, Biophys J, 2008
Hajdú I, Bőthe C, Szilágyi A, Kardos J, Gál P, Závodszky P: Adjustment of conformational flexibility of glyceraldehyde-3-phosphate dehydrogenase as a means of thermal adaptation and allosteric regulation., Eur Biophys J, 37(7):1139-44., 2008
Kamondi S, Szilágyi A, Barna L, Závodszky P: Engineering the thermostability of a TIM-barrel enzyme by rational family shuffling., Biochem Biophys Res Commun, 374:725-730., 2008
Nimrod G, Szilágyi A, Leslie C, Ben-Tal N: Identification of DNA-binding proteins using structural, electrostatic and evolutionary features., J Mol Biol, 387(4):1040-53., 2009
Hajdú I, Szilágyi A, Kardos J, Závodszky P: A link between hinge-bending domain motions and the temperature dependence of catalysis in IPMDH., Biophys J, 96(12):5003-12., 2009
Than NG, Romero R, Goodman M, Weckle A, Xing J, Dong Z, Xu Y, Tarquini F, Szilágyi A, Gál P, Hou Z, Tarca AL, Kim CJ, Kim JS, Haidarian S, Uddin M, Bohn H, Benirschke K, Santolaya-Forgas J, Grossman LI, Erez O, Hassan SS, Závodszky P, Papp Z, Wildman DE: From birth to death: evolution of a primate subfamily of galectins expressed at the maternal-fetal interface that promote T-cell apoptosis, Proc Natl Acad Sci USA, 106(24):9731-6., 2009
Mukherjee S, Szilagyi A, Roy A, Zhang Y: Genome-wide protein structure prediction, Kolinski A (ed.): Multiscale approaches to protein modeling: structure prediction, dynamics, thermodynamics and macromolecular assemblies. Springer-London, 2010
Kucukural A, Szilagyi A, Sezerman O, Zhang Y: Protein homology analysis for function prediction with parallel sub-graph isomorphism, Lodhi H, Yamanishi Y (eds.): Chemoinformatics: Advances in Chemoinformatics and Computational Methods. IGI Global, 2010
Nimrod G, Schushan M, Szilagyi A, Leslie C, Ben-Tal N: iDBPs: A web server for the identification of DNA binding proteins, Bioinformatics, 26(5):692-693., 2010
Wu S, Szilágyi A, Zhang Y: Improving protein structure prediction using multiple sequence-based contact predictions, Structure, in press, 2011