protein-protein interactions, protein binding, alternative splicing, sequence similarity, linear motifs, paralogs, orthologs
Discipline
Bioinformatics (Council of Medical and Biological Sciences)
100 %
Panel
Genetics, Genomics, Bioinformatics and Systems Biology
Department or equivalent
Institute of Enzymology, BRC, Hungarian Academy of Sciences
Starting date
2009-04-01
Closing date
2012-04-30
Funding (in million HUF)
22.101
FTE (full time equivalent)
2.26
state
closed project
Summary in Hungarian
A bioinformatika-rendszerbiológia homlokterében néhány évvel ezelőtt (az ilyen jellegű nagy áteresztő képességű kísérletes rendszerek elterjedésével párhuzamosan) megjelent a fehérje-fehérje kölcsönhatások vizsgálata, mint a fehérje funkciójának feltárásához alapvetően szükséges információ.
A fehérje-fehérje kölcsönhatások létrejöhetnek globuláris fehérjedoménok vagy rövid lineáris peptid-szegmensek vagy ezek valamilyen kombinációja között. Míg számos domén-domén kölcsönhatást leírtak és jellemeztek már az irodalomban, csak viszonylag kevés információ ismert a lineáris motívumokról, melyek általában rendezetlen fehérjékben vagy (globuláris fehérjék ill. doménekben taláható) rendezetlen peptid szegmenseken találhatók. Ez utóbbiakból jelenleg 133 található az ELM (elm.eu.org) adatbázisban, amely az egyik legátfogóbb ilyen jellegű gyűjtemény, bár ennél nyilván nagyságrendekkel több kötőhely-mintázat létezik a valóságban, különösen a többsejtű élőlényekben, ahol a fehérje-fehérje kölcsönhatások száma ugrásszerűen megnő az evolúció során.
A pályázatban leírt kutatás során egyrészt új kötőhelyek azonosítása a cél, másrészt a meglévőek előfordulásának gyakorisága alternatív splice variánsok és paralógok kötődési affinitása közötti különbségek alapján. Az alapötlet nagyon leegyszerűsítve a következő: 1. ha két nagyon hasonló fehérje (paralógok vagy alternatív splicing variánsok) szekvenciája között van egy kicsi, de jól definiált különbség, amely a vizsgálatok szerint a fehérje felszínén található (pl. egy 6-8 aminosav hosszú peptid darab beszúródása az egyik fehérjébe) és az őket kötő fehérjék is konzisztens módon különböznek (pl. két faj között ugyanúgy), akkor nagy valószínűséggel a kötődésbeli különbség a szekvencia különbségnek (beszúródásnak) tulajdonítható.
Summary
In recent years studies of protein-protein interactions have become one of the focal points of bioinformatics/system biology, in accordance with the appearance of high-throughput experiments aiming at discovering protein-protein interactions on a large/genomic scale.
Protein-protein interactions might exist between globular domains or short linear motifs or some combination of the two. While many interactions between globular domains are known and have been described in the literature, only relatively little is known about linear motifs. These latter are often found in disordered proteins or disordered segments of otherwise ordered, globular proteins/domains. The most extensive collection of such linear motifs is ELM (Eukaryotic Linear Motifs, website: elm.eu.org) and it contains only 132 such motifs as of writing (Feb, 2008). Apparently, there are many more (possibly by several orders of magnitude) such motifs in reality, waiting to be discovered. They are particularly abundant in metazoan organisms due to the fast evolution of proteins and also protein-protein interactions in these organisms.
The aims of the research to be described here are the following: 1. identification of new binding sites/linear motifs , 2. studying the conservation of protein-protein interactions in different organisms (orthologs) and same organism but proteins with different functions (paralogs), 3. alternative splicing as the facilitator of switching on/off different protein-protein interactions in different environment (e.g. different tissues). The basic idea of the planned research is the following: if we have information about the difference in protein interactions between two paralogs/orthologs/splice variants we can attribute the difference in binding to the difference in the protein sequence/structure. If these differences are well-defined both in terms of the interactions and the protein sequences, they can be easily related to one another.