Genome annotation  Page description

Help  Print 
Back »

 

Details of project

 
Identifier
91119
Type PD
Principal investigator Nagy, Alinda
Title in Hungarian Genom annotáció
Title in English Genome annotation
Keywords in Hungarian genom annotáció, génpredikció, minőségellenőrzés, funkció jóslás
Keywords in English genome annotation, gene prediction, quality control, function prediction
Discipline
Bioinformatics (Council of Medical and Biological Sciences)100 %
Panel Genetics, Genomics, Bioinformatics and Systems Biology
Department or equivalent Institute of Enzymology, BRC, Hungarian Academy of Sciences
Starting date 2011-09-01
Closing date 2014-08-31
Funding (in million HUF) 2.242
FTE (full time equivalent) 2.40
state closed project
Summary in Hungarian
Mivel nagyon nehéz meghatározni a magasabb rendű eukarióták fehérjekódoló génjeinek helyes genomikus szerkezetét, a nyilvános adatbázisokban sok tévesen megjósolt gén és fehérjeszekvencia található.

A korábbi MisPred projektünk fő célja olyan eszközök kifejlesztése volt, amelyek lehetővé teszik a tévesen megjósolt gének/fehérjék automatizált azonosítását és így a predikciók minőségének javítását. A megközelítés alapja, hogy egy fehérjekódoló gén valószínűleg tévesen megjósolt, ha a gén (vagy az általa kódolt fehérje) jellemzői nincsenek összhangban a fehérjekódoló génekről és a fehérjékről alkotott jelenlegi tudásunkkal. A korábbi munka során elemeztük különböző Metazoa fajok fehérje adatbázisait, azonosítottuk a hibás fehérje szekvenciákat és a vizsgálatok eredményeinek publikálására létrehoztuk a MisPred adatbázist.

A jelenlegi kutatás célkitűzései:
1. Új hibaazonosítási módszerek kidolgozása további hibatípusok azonosítására.
2. További eukarióta genomok bevonása a vizsgálatokba. Nyilvános fehérje adatbázisok legutóbbi verzióinak elemzése és a MisPred adatbázis folyamatos frissítése.
3. A MisPred által hibásként azonosított gének/fehérjék szerkezetének kijavítására alkalmas FixPred módszer kidolgozása és a kijavított szekvenciákat tartalmazó FixPred adatbázis létrehozása.
4. A kijavított gének/fehérjék funkciójának és biológiai szerepének predikciója, új predikciós módszerek alkalmazásával.
5. Automatizált eljárás kidolgozása az orvosbiológiai, agrárbiológiai vagy biotechnológiai szempontból hasznosítható gének kiválasztására.
Summary
Correct prediction of the genomic structure of the protein-coding genes of higher eukaryotes is a very difficult task, thus sequences of incorrectly predicted genes and proteins are abundant in public databases.

The main objective of our MisPred project was to develop tools that can be used to identify mispredicted genes/proteins and to improve the quality of predictions. The MisPred approach is based on the principle that a protein-coding gene is likely to be mispredicted if some of its features (or features of the protein it encodes) conflict with our current knowledge about protein-coding genes and proteins. In our previous work we have analyzed protein databases of different metazoan species, identified erroneous protein sequences and have established the MisPred database for the publication of the results of MisPred analyses.

In the proposed research:
1. We will develop new MisPred tools for the identification of additonal types of errors.
2. We will analyze recent versions of protein databases and additional eukaryotic genomes and will continually update the MisPred database.
3. We will develop the FixPred method to correct the structure of genes/proteins identified as mispredicted or abnormal by MisPred and will establish the FixPred database in which corrected sequences will be deposited.
4. We will predict the function and biological role of the corrected genes/proteins, using novel tools.
5. We will develop procedures for the selection of genes that are likely to be useful for medicine, agriculture or biotechnology.




Back »