Functional sites of intrinsically disordered proteins  Page description

Help  Print 
Back »

 

Details of project

 
Identifier
108798
Type K
Principal investigator Dosztányi, Zsuzsanna
Title in Hungarian Rendezetlen fehérjék funkcionális helyei
Title in English Functional sites of intrinsically disordered proteins
Keywords in Hungarian flexibilitás, fehérje-fehérje kölcsönhatás, molekuláris felismerés
Keywords in English flexibility, protein-protein interactions, molecular recognition
Discipline
Bioinformatics (Council of Medical and Biological Sciences)80 %
General biochemistry and metabolism (Council of Medical and Biological Sciences)20 %
Ortelius classification: Molecular biology
Panel Genetics, Genomics, Bioinformatics and Systems Biology
Department or equivalent MTA-ELTE Lendület Bioinformatics Research Group (Office for Research Groups Attached to Universities and Other Institutions)
Participants Erdős, Gábor
Hajdu-Soltész, Borbála
Pajkos, Mátyás
Reményi, Attila
Sebestyén, László
Starting date 2013-09-01
Closing date 2018-08-31
Funding (in million HUF) 35.677
FTE (full time equivalent) 14.14
state closed project
Summary in Hungarian
A kutatás összefoglalója, célkitűzései szakemberek számára
Itt írja le a kutatás fő célkitűzéseit a témában jártas szakember számára.

Az elmúlt évek kutatásai rámutattak arra, hogy a humán genom jelentős része rendezetlen fehérjéket kódol, amelyeknek önmagukban nincsen jól meghatározott térszerkezetük. Ezen fehérje szakaszok szerkezeti flexibilitása a rájuk jellemző aminosav összetételből ered, mely nem teszi lehetővé az autonóm feltekeredésüket. A rendezetlen fehérjék nagy számban tartalmaznak rövid kölcsönható régiókat, illetve lineáris motívumokat, amelyek segítségével fehérje-fehérje kölcsönhatásokban tudnak részt venni. Ezek révén esszenciális folyamatban vesznek részt és kulcsfontosságú szerepet töltenek be a sejten belüli jelátviteli hálózatokban. Azonban a lineáris motívumok által kialakított fehérje-fehérje interaktom nagy része, illetve ezek szerepe a különböző betegségek kialakulásában a mai napig nagyrészt felderítetlen.

A jelen projekt célja, hogy új szintre emelje a humán proteom rendezetlen részének megismerését és funkcionális annotációját. Munkánk során kísérletes techikákat ötvözünk új számítógépes megközelítésekkel. Célunk, hogy felderítsük a mitogén aktivált fehérje kinázok (MAPK) jelpályájában résztvevő specifikus lineáris kötő motívumok rendszer szintű előfordulását. Továbbá, kihasználva a rák genom projektek új kutatási eredményeit, új fehérje-lineáris motívum kölcsönhatásokat akarunk felderíteni nagyskálás módon, melyek funkcionális és gyógyszerkutatási jelentőséggel rendelkeznek. Ezen célok megvalósításának érdekében merőben újszerű számítógépes módszereket dolgozunk ki a meglévő szerkezeti és funkcionális információk alapján. A jelen projekt célja, hogy elmélyítse a fehérje-lineáris motívumok által kialakított kölcsönhatások alapvető folyamatának megértését.

Mi a kutatás alapkérdése?
Ebben a részben írja le röviden, hogy mi a kutatás segítségével megválaszolni kívánt probléma, mi a kutatás kiinduló hipotézise, milyen kérdéseket válaszolnak meg a kísérletek.

A rendezetlen fehérjék biológiai felismerése sokáig váratott magára, és mind a mai napig a kísérletes és számítógépes leírásuk is nagy kihívást jelent. Speciális szerkezeti tulajdonságaik, amelyek alapvetően eltérnek a rendezett fehérjéknél megszokottól, megmutatkoznak funkciójukban és betegségekben játszott szerepükben is. Nagymértékű flexibilitásuk és gyenge kölcsönhatásaik miatt a rendezetlen fehérjék kölcsönható helyei nehezen vizsgálhatók kísérletesen, amely elengedhetetlenné teszi újszerű számítógépes megközelítések kifejlesztését. A jelen projekt központi kérdése, hogy a rendezetlen fehérjék hogyan látják el funkcióikat molekuláris- és rendszer szinten, valamint hogy meghibásodásaik milyen szerepet játszanak komplex betegségek – mint például a rák – kialakulásában. Bár már a jelenlegi számítógépes módszerek is segíthetnek a rendezetlen fehérjék funkcionális helyeinek meghatározásában, nem elégségesek nagyskálás vizsgálatok elvégzéséhez. Jelen projekt nagyban hozzájárulhat, hogy megértsük a lineáris motívumok szelektivitása és a motívumok kontextusának a kötési erősségre gyakorolt hatása mögött meghúzódó fizikai tényezők járulékait. Emellett a projekt tovább bővíti a MAPK lineáris motívumokkal kapcsolatos ismereteinket, mely segítségével összehasonlító evolúciós vizsgálatok végezhetők, és ennek révén betekintést nyerhetünk ezen motívumok kialakulásának genetikai mechanizmusába. Vizsgálataink nagyszámú, funkcionális fontosságal bíró rendezetlen fehérjére is rámutatnak. Továbbá jelen projektben új kutatási eszközöket is kifejlesztünk, melyek segítségével a rendezetlen fehérjék interaktoma tovább vizsgálható.

Mi a kutatás jelentősége?
Röviden írja le, milyen új perspektívát nyitnak az alapkutatásban az elért eredmények, milyen társadalmi hasznosíthatóságnak teremtik meg a tudományos alapját. Mutassa be, hogy a megpályázott kutatási területen lévő hazai és a nemzetközi versenytársaihoz képest melyek az egyediségei és erősségei a pályázatának!

A rendezetlen fehérjék egy viszonylag újonnan felfedezett fehérje osztályt jelentenek, amelyet a jól meghatározott három dimenziós szerkezet hiánya definiál. A rájuk vonatkozó jelenlegi ismereteink nagyrészt csak egy-két jól körülírt példából származnak. Emellett nagyskálás bioinformatikai vizsgálatok rámutattak, hogy általában a rendezetlen fehérjék aminosav összetétele speciális, valamint hogy nagy arányban fordulnak elő, főleg eukariótákban. Hasonló vizsgálatok megállapították, hogy ezen fehérjék számos alapvető biológiai funkciót töltenek be, melyekhez a rendezetlen állapot elengedhetetlen. A rendezetlen fehérjéket tartalmazó komplexek speciális tulajdonságai érhetővő teszik szabályozási és jeltáviteli folyamatokban megfigyelt gyakoriságukat. Fontosságuk ellenére, a rendezetlen fehérjék funkcinális helyei nagyrészt még mindig feltérképezetlenek.
A rendezetlen fehérjék fontosságát támasztja alá a különböző betegségekben, különösen a rákban való részvételük. Azonban ezen betegségekben játszott pontos szerepüket csak korlátozottan ismerjük, amelyért a szerkezeti és betegség-központú kutatások nem kiegyensúlyozott felépítése felelős. Ezzel szemben a mostani nagyskálás rák genom kutatások segítségével lehetővé vált a fehérje szerkezet központi szerepétől való elszakadás és a rendezetlen fehérjék betegségekben betöltött szerepének pontosabb megismerése. A rendezetlen fehérjék kölcsönhatásainak részletes vizsgálatai új, a betegségekkel szembeni beavatkozási pontokkal szolgálhatnak. Így a rendezetlen fehérjék megértése nem csak alapkutatási szempontból fontos, hanem gyakorlati jelentősséggel is bír: a rendezetlen fehérjék pontos leírása nem csak az alapvető szabályzási folyamatok megértéséhez szükséges, hanem a hatékonyabb diagnosztika- és gyógyszertervezéshez is nélkülözhetetlen. Továbbá új számítógépes módszereket fogunk kifejleszteni, melyeket a kutatók széles köre fogja tudni használni.

A kutatás összefoglalója, célkitűzései laikusok számára
Ebben a fejezetben írja le a kutatás fő célkitűzéseit alapműveltséggel rendelkező laikusok számára. Ez az összefoglaló a döntéshozók, a média illetve az adófizetők tájékoztatása szempontjából különösen fontos az NKFI számára.

A genom tartalmazza az egyes élőlények teljes örökletes anyagát és a kódolja a fehérjekészletüket. Az ezredforduló tájékára több élőlény genomját leírták. Nem várt módon, ez az információ jelentősen kiszélesítette a fehérjékről kialakított képünket. A hagyományos elképzelés szerint feltételezték, hogy a funkcionális szempontból fontos fehérjéknek működéséhez elengedhetetlen egy jól meghatározott szerkezetet. A különböző genom projektek révén azonban kiderült, hogy a genom jelentős része kódol olyan fehérjéket, amelyek nagymértékű flexibilitással rendelkeznek, és nem alakítanak ki ilyen jól meghatározott szerkezetet, ennek ellenére jelentős funkciók ellátására képesek. Ezeket a fehérjéket eredendően rendezetlen fehéjréknak nevezték el. Ezek a fehérjék nem csak szerkezetileg különböznek a korábban jól ismert globuláris fehérjéktől, hanem funkciójukban is. Alapvető biológiai fontosságú folyamatokban vesznek részt, és gyakran kapcsolhatók különböző megbetegedésekhez, mint pl. rák vagy neurodegeneratív megbetegedések. A jelenlegi projekt fő célja ezen fehérjéknek funkcionális tulajdonságainak, komplex biológiai folyamatokban és különböző betegségekben betöltött szerepük megértésére irányul, a számítógépes és kísérletes eredmények kombinálása révén. Kifejlesztünk új száímtógépes módszereket és különböző elemzések végzünk, amelyek segítnek majd megérteni, hogy a rendezetlen fehérjék hogyan látják el funkciójukat és mi a szerepük különböző betegségekben.
Summary
Summary of the research and its aims for experts
Describe the major aims of the research for experts.

Recent observations have shown that a large proportion of the human genome encodes intrinsically unstructured/disordered proteins (IDPs) that do not adopt a stable structure in isolation. The highly flexible nature of these proteins and protein regions originates from their specific amino acid composition that is not compatible with autonomous folding. IDPs are abundant in short binding regions and linear motifs that are involved in protein-protein interactions. These functional regions participate in many vital cellular functions and are key components of cell signalling networks. Nevertheless, the linear motif mediated protein-protein interactome and its role in various diseases is still largely unexplored.

The aim of this proposal is to bring the functional annotation of the disordered part of the proteome to a completely new level. In this project we will combine experimental results with novel computational approaches. Our goal is to explore the system level occurrences of a specific linear binding motif class involved in signaling pathways of mitogen activated protein kinases (MAPK). Furthermore, taking advantage of emerging data of cancer genomic projects, we also aim to discover novel protein-linear motif mediated interactions of functional and biomedical relevance at a larger-scale. To achieve these goals we will develop highly original computational approaches that can exploit available structural and functional information. At the same time, the aim of this proposal is to significantly improve our understanding of the basic principles governing proteins-linear motif binding.

What is the major research question?
Describe here briefly the problem to be solved by the research, the starting hypothesis, and the questions addressed by the experiments.

Intrinsically disordered proteins (IDPs) escaped biological characterization for a long time and their study remains challenging experimentally as well as computationally. Disordered proteins have distinct structural properties compared to globular proteins which has important consequences in terms of both function and disease-association. Due to their highly flexible nature and their weak interactions, functional binding sites within disordered protein regions are difficult to study experimentally, which necessitates new and innovative computational methods for their characterization. The main question of this proposal is how IDPs carry out their functions at the molecular level and system level, and how their malfunctions contribute to complex diseases such as cancer. Although current computational methods can already give important guidance in exploring functionally important sites within disordered proteins, they are not sufficient for for large-scale studies. This project can significantly advance our understanding on how various physical factors contribute to the binding selectivity of linear motifs and how the structural context of linear motifs contribute to the binding. The project will also provide more detailed knowledge on MAPK linear motifs, paving the way to the comparative evolutionary analysis and giving insights into the genetic mechanisms promoting their emergence. Our analysis will also highlight a large number of functionally important disordered protein regions. Additionally, this project will also provide original research tools that can be used to further explore the interactome of disordered proteins.

What is the significance of the research?
Describe the new perspectives opened by the results achieved, including the scientific basics of potential societal applications. Please describe the unique strengths of your proposal in comparison to your domestic and international competitors in the given field.

Intrinsically unstructured/disordered proteins (IDPs) constitute a recently recognized class of proteins, characterized by the lack of a well-defined three-dimensional structure. Our current understanding of these proteins originates in part from detailed studies of a handful of IDPs. Additionally, large-scale bioinformatics analyses revealed that, in general, disordered proteins have distinct amino acid compositions and are surprisingly common, especially in eukaryotes. Similar studies established that IDPs are involved in many vital cellular functions and all these functions rely on their highly flexible state. The specific properties of complexes involving disordered proteins ensure their prevalence in regulatory and signaling processes. Despite their importance, functional sites within disordered proteins are still largely unexplored.

The importance of protein disorder is also underlined by their association with various diseases, especially with cancer. However, our current understanding of the exact role of IDPs in these diseases is rather limited due to biases present in not only structural but in disease-association studies as well. Large-scale cancer genome projects now enable us to move away from the structure-centric view in disease association studies, and to explore the role of IDPs in diseases. Investigating the molecular details of the interactions of disordered proteins can pave the way for novel drug design strategies, while understanding the role of disordered proteins in various diseases can suggests points of intervention. Therefore, understanding protein disorder is crucial not only for basic science, but also for practical purposes: the accurate characterization of IDPs is not only crucial for the better understanding of basic regulatory processes in living organisms, but can aid the development of better diagnostics and drugs. We will also provide new computational tools that the wider research community could use.

Summary and aims of the research for the public
Describe here the major aims of the research for an audience with average background information. This summary is especially important for NKFI in order to inform decision-makers, media, and the taxpayers.

The genome contains the complete heredity information of an organism and encodes its protein repertoire. By the turn of century, the genome of several organisms have been deciphered. Unexpectedly, this information has significantly broadened our view of the protein world. According to the traditional view, functionally important proteins needed to adopt a well-defined structure. As a result of the genome projects it turned out that a large part of the genome encodes proteins that can exist and function without a well-defined structure. They are called intrinsically disordered proteins. They are different from the well-characterized globular proteins not only structurally, but also functionally. They are involved in many vital biological processes, and also associated with important diseases such as cancer or neurodegenerative diseases. The main purpose of this project is to understand the functional properties of this newly discovered class of proteins and their role in complex biological processes in diseases, through the combination of experimental and computational analyses. We will develop novel computational methods and carry out analyses that will help to understand how disordered proteins carry out their function, and what is their role in diseases.





 

Final report

 
Results in Hungarian
A humán genom egy jelentős része időben állandó térszerkezetttel nem rendelkező, ún. rendezetlen fehérje szegmenst kódol. Ezek esszenciális biológia folyamatokban vesznek részt és számos betegségben is szerepet játszanak, de ma még viszonylag kevéssé feltártak. A pályázat során jelentős előrelépéseket tettek a humán proteom rendezetlen részének megismerésére és funkcionális annotációjára. A projekt keretében egyrészt a jeltátvitelben központi szereppel bíró mitogén aktivált fehérje kinázok (MAPK), illetve a dinein könnyű láncok kölcsönhatási hálózatát térképezték fel rendszer szinten a partner fehérjék kötőmotívumainak azonosítása révén. Ehhez specifikus bioinformatikai szűrő eljárásokat fejlesztettek ki. A rákos mutációk elemezése révén olyan rendezetlen fehérje szegmenseket azonosítottak, amelyek genetikai variációja aktívan hozzájárulhat a rák kialakulásához és rámutattak arra, hogy az ilyen mutációkat tartalmazó minták jelenleg nagyobb kihívást jelentenek a kezelhetőség szempontjából. A pályázat keretében több módszert és adatbázist is ki-, illetve továbbfejlesztettek. Ezek mellett, elemzéseik segítenek megérteni a rendezetlen fehérjék kölcsönhatásainak speciális szekvenciális, szerkezeti, evolúciós és funkcionális tulajdonságait. A pályázat során 12 cikket és két könyvfejezetet publikáltak, két további kézirat elérhető preprintként, és további közlemények is várhatóak.
Results in English
A large proportion of the human genome encodes intrinsically disordered protein segments (IDPs) that do not adopt a stable structure in isolation. These regions play key roles in essential biological processes and are involved in various diseases, nevertheless, they are largely unexplored. As a result of the project, the functional annotation of the disordered part of the proteome is significantly advanced. They explored the system level occurrences of a specific linear binding motif class involved in the signaling pathways of mitogen activated protein kinases (MAPK) and also explored the interaction network of the dynein light chain LC8. For these, they developed specific bioinformatic filtering protocols. Taking advantage of emerging data of cancer genomic projects, they identified intrinsically disordered protein regions whose mutations can actively drive tumor development but also showed that sample containing such mutations are more challenging in terms of treatment options. They developed and improved various computational tools and approaches. In addition, they also significantly improved our understanding of the basic principles governing the interactions of disordered proteins in terms of their sequential, structural, evolutionary and functional properties. During the project they published 12 papers and two book chapters, two manuscripts are available as preprints and additional publications can be expected.
Full text https://www.otka-palyazat.hu/download.php?type=zarobeszamolo&projektid=108798
Decision
Yes





 

List of publications

 
Zeke A, Bastys T, Alexa A, Garai Á, Mészáros B, Kirsch K, Dosztányi Z, Kalinina OV, Reményi A.: Systematic discovery of linear binding motifs targeting an ancient protein interaction surface on MAP kinases., Mol Syst Biol, 2015
Mészáros B, Zeke A, Reményi A, Simon I, Dosztányi Z: Systematic analysis of somatic mutations driving cancer: Uncovering functional protein regions in disease development, BIOLOGY DIRECT, 2016
Mészáros B, Kumar M, Gibson TJ, Uyar B, Dosztányi Z: Degrons in cancer, Science Signalling, 2017
Piovesan D, Tabaro F, Mičetić I, Necci M, Quaglia F, Oldfield CJ, Aspromonte MC, Davey NE, Davidović R, Dosztányi Z, Elofsson A, Gasparini A, Hatos A, Kajava AV, Kalmar L, Leonardi E, Lazar T, Macedo-Ribeiro S, Macossay-Castillo M, Meszaros A, Minervini G, Murvai N, Pujols J, Roche DB, Salladini E, Schad E, Schramm A, Szabo B, Tantos A, Tonello F, Tsirigos KD, Veljković N, Ventura S, Vranken W, Warholm P, Uversky VN, Dunker AK, Longhi S, Tompa P, Tosatto SC.: DisProt 7.0: a major update of the database of disordered proteins, Nucleic Acid Resarch, 2017
Necci M, Piovesan D, Dosztányi Z, Tosatto SCE: 3. Necci M, Piovesan D, Dosztányi Z, Tosatto SCE. MobiDB-lite: fast and highly specific consensus prediction of intrinsic disorder in proteins., Bioinformatics, 2017
Necci M, Piovesan D, Dosztanyi Z, Tompa and Tosatto SC: A comprehensive assessment of long intrinsic protein disorder from the DisProt database, Bioinformatics, in press, 2017
Dosztányi Z, Tompa P.: Bioinformatics Approaches to the Structure and Function of Intrinsically Disordered Proteins, Protein Structure to Function with Bioinformatics., 2017
Necci M, Piovesan D, Dosztányi Z, Tosatto SCE: MobiDB-lite: fast and highly specific consensus prediction of intrinsic disorder in proteins., Bioinformatics, 2017
Necci M, Piovesan D, Dosztanyi Z, Tompa and Tosatto SC: A comprehensive assessment of long intrinsic protein disorder from the DisProt database, Bioinformatics, 2017
Erdős G, Szaniszló T, Pajkos M, Hajdu-Soltész B, Kiss B, Pál G, Nyitray L, Dosztányi Z.: Novel linear motif filtering protocol reveals the role of the LC8 dynein light chain in the Hippo pathway., PLoS Computational Biology, 2017
Gouw M, Michael S, Sámano-Sánchez H, Kumar M, Zeke A, Lang B, Bely B, Chemes LB, Davey NE, Deng Z, Diella F, Gürth CM, Huber AK, Kleinsorg S, Schlegel LS, Palopoli N, Roey KV, Altenberg B, Reményi A, Dinkel H, Gibson TJ.: The eukaryotic linear motif resource - 2018 update., Nucleic Acid Research, 2018
Schad E, Fichó E, Pancsa R, Simon I, Dosztányi Z, Mészáros B: DIBS: a repository of disordered binding sites mediating interactions with ordered proteins., Bioinformatics, 2018
Dosztányi Z: Prediction of protein disorder based on IUPred., Protein Science, 2018
Mészáros B, Erdos G, Dosztányi Z: IUPred2A: context-dependent prediction of protein disorder as a function of redox state and protein binding., Nucleic Acid Research, 2018
Piovesan D, Tabaro F, Paladin L, Necci M, Micetic I, Camilloni C, Davey N, Dosztányi Z, Mészáros B, Monzon AM, Parisi G, Schad E, Sormanni P, Tompa P, Vendruscolo M, Vranken WF, Tosatto SCE.: MobiDB 3.0: more annotations for intrinsic disorder, conformational diversity and interactions in proteins., Nuhcleic Acid Researc, 2018
Punta M, Simon I, and Dosztányi Z: Prediction and Analysis of Intrinsically Disordered Proteins, Structural Proteomics: High-Throughput Methods, Methods in Molecular Biology, vol. 1261, 2015





 

Events of the project

 
2015-11-13 08:58:00
Résztvevők változása
2014-03-27 13:13:55
Résztvevők változása
2013-08-29 23:09:59
Résztvevők változása




Back »