Genom annotáció  részletek

súgó  nyomtatás 
vissza »

 

Projekt adatai

 
azonosító
91119
típus PD
Vezető kutató Nagy Alinda
magyar cím Genom annotáció
Angol cím Genome annotation
magyar kulcsszavak genom annotáció, génpredikció, minőségellenőrzés, funkció jóslás
angol kulcsszavak genome annotation, gene prediction, quality control, function prediction
megadott besorolás
Bioinformatika (Orvosi és Biológiai Tudományok Kollégiuma)100 %
zsűri Genetika, Genomika, Bioinformatika és Rendszerbiológia
Kutatóhely MTA SzBK Enzimológiai Intézet
projekt kezdete 2011-09-01
projekt vége 2014-08-31
aktuális összeg (MFt) 2.242
FTE (kutatóév egyenérték) 2.40
állapot lezárult projekt
magyar összefoglaló
Mivel nagyon nehéz meghatározni a magasabb rendű eukarióták fehérjekódoló génjeinek helyes genomikus szerkezetét, a nyilvános adatbázisokban sok tévesen megjósolt gén és fehérjeszekvencia található.

A korábbi MisPred projektünk fő célja olyan eszközök kifejlesztése volt, amelyek lehetővé teszik a tévesen megjósolt gének/fehérjék automatizált azonosítását és így a predikciók minőségének javítását. A megközelítés alapja, hogy egy fehérjekódoló gén valószínűleg tévesen megjósolt, ha a gén (vagy az általa kódolt fehérje) jellemzői nincsenek összhangban a fehérjekódoló génekről és a fehérjékről alkotott jelenlegi tudásunkkal. A korábbi munka során elemeztük különböző Metazoa fajok fehérje adatbázisait, azonosítottuk a hibás fehérje szekvenciákat és a vizsgálatok eredményeinek publikálására létrehoztuk a MisPred adatbázist.

A jelenlegi kutatás célkitűzései:
1. Új hibaazonosítási módszerek kidolgozása további hibatípusok azonosítására.
2. További eukarióta genomok bevonása a vizsgálatokba. Nyilvános fehérje adatbázisok legutóbbi verzióinak elemzése és a MisPred adatbázis folyamatos frissítése.
3. A MisPred által hibásként azonosított gének/fehérjék szerkezetének kijavítására alkalmas FixPred módszer kidolgozása és a kijavított szekvenciákat tartalmazó FixPred adatbázis létrehozása.
4. A kijavított gének/fehérjék funkciójának és biológiai szerepének predikciója, új predikciós módszerek alkalmazásával.
5. Automatizált eljárás kidolgozása az orvosbiológiai, agrárbiológiai vagy biotechnológiai szempontból hasznosítható gének kiválasztására.
angol összefoglaló
Correct prediction of the genomic structure of the protein-coding genes of higher eukaryotes is a very difficult task, thus sequences of incorrectly predicted genes and proteins are abundant in public databases.

The main objective of our MisPred project was to develop tools that can be used to identify mispredicted genes/proteins and to improve the quality of predictions. The MisPred approach is based on the principle that a protein-coding gene is likely to be mispredicted if some of its features (or features of the protein it encodes) conflict with our current knowledge about protein-coding genes and proteins. In our previous work we have analyzed protein databases of different metazoan species, identified erroneous protein sequences and have established the MisPred database for the publication of the results of MisPred analyses.

In the proposed research:
1. We will develop new MisPred tools for the identification of additonal types of errors.
2. We will analyze recent versions of protein databases and additional eukaryotic genomes and will continually update the MisPred database.
3. We will develop the FixPred method to correct the structure of genes/proteins identified as mispredicted or abnormal by MisPred and will establish the FixPred database in which corrected sequences will be deposited.
4. We will predict the function and biological role of the corrected genes/proteins, using novel tools.
5. We will develop procedures for the selection of genes that are likely to be useful for medicine, agriculture or biotechnology.




vissza »