Mathematical analysis of biological graphs  Page description

Help  Print 
Back »

 

Details of project

 
Identifier
126472
Type KH
Principal investigator Grolmusz, Vince
Title in Hungarian Biológiai gráfok matematikai elemzése
Title in English Mathematical analysis of biological graphs
Keywords in Hungarian gráfok, hálózatok, biológiai hálózatok
Keywords in English graphs, networks, biological networks
Discipline
Mathematics (Council of Physical Sciences)100 %
Ortelius classification: Applied mathematics
Panel Mathematics and Computing Science
Department or equivalent Department of Computer Science (Eötvös Loránd University)
Participants Szalkai, Balázs
Takács, Kristóf
Varga, Bálint
Starting date 2017-12-01
Closing date 2020-02-29
Funding (in million HUF) 20.000
FTE (full time equivalent) 1.01
state closed project
Summary in Hungarian
A kutatás összefoglalója, célkitűzései szakemberek számára
Itt írja le a kutatás fő célkitűzéseit a témában jártas szakember számára.

A biológiában nap mint nap óriási mennyiségű mérési adat keletkezik. Ezek feldolgozása, tárolása, szűrése az élettudományi képzettségű kutatók számára nehéz, és ehhez az informatikai képzettségű kutatóknak is mély matematikai eszközökre van szüksége. A pályázat alapját képező, sokat idézett cikk (Scopus: 5 független idézet, Google Scholar: 30 idézet) a jelenlegi mindennapjainkra nagy hatást gyakorló gráf-függvényről, a Google PageRangjáról bizonyítja, hogy irányítatlan gráfokra - bizonyos értelemben - a legritkább esetben fordul elő az, hogy a csúcsok PageRangja arányos a fokszámmal. Pontosabban, a cikk szükséges és elégséges feltételt ad erre a jelenségre. A Google PageRangja volt az az eszköz, amely megalapozta a világon a mai legértékesebb részvénytársaság, a Google Inc. sikerét: a Google webkeresője azért lett a legnépszerűbb kereső, mert az egyes kulcsszavakra való keresés eredményekét megtalált weboldalakat a PageRang szerint sorolta fel, a nagyobb PageRangút adta ki előbb. Mivel mindannyiunk naponta sokszor használja a Google keresőjét, a PageRang a mai életünket nagyon befolyásoló gráf-függvény (bár a Google keresőjének mai verziói a PageRangot már nem az eredeti formájában használják, a jelenlegi kereső felépítése nem nyílvános).
Jelen pályázat nagy biológiai hálózatok analízisére dolgoz ki új módszereket, matematikai megalapozottsággal. Pontosabban már ismert, de a biológiában még nem használt matematikai eszközöket alkalmazunk biológiai hálózatok elemezésére, illetve új matematikai eszközöket fejlesztünk ki erre a célra. A kifejlesztett eszközöknek robosztusaknak kell lenniük, mivel a biológiai hálózatok leírása általában sok hibát tartalmaz.

Mi a kutatás alapkérdése?
Ebben a részben írja le röviden, hogy mi a kutatás segítségével megválaszolni kívánt probléma, mi a kutatás kiinduló hipotézise, milyen kérdéseket válaszolnak meg a kísérletek.

Mely matematikai gráftulajdonságok használhatók fel biológiai hálózatok biológiai sajátságainak jellemzésére? Itt fontosnak tartjuk, hogy sok kutatóval szemben inkább a gráfelmélet által régen tanulmányozott tulajdonságok alkalmazhatóságát vizsgáljuk, és nem ad hoc definiált, sokszor túlegyszerűsített, többnyire élszámlálással definiált függvényt nézünk különböző csúcshalmazok között, mint ahogy azt sok más kutató teszi. Eddigi munkáinkban mutattunk több PageRangra alapozott, robusztus függvényt, amellyel csúcsok fontosságát jól leírhatjuk. Ezt a kutatási irányt akarjuk továbbfejleszteni a jelen projekt keretében.

Mi a kutatás jelentősége?
Röviden írja le, milyen új perspektívát nyitnak az alapkutatásban az elért eredmények, milyen társadalmi hasznosíthatóságnak teremtik meg a tudományos alapját. Mutassa be, hogy a megpályázott kutatási területen lévő hazai és a nemzetközi versenytársaihoz képest melyek az egyediségei és erősségei a pályázatának!

A fejlett, nagy átbocsájtóképességű biológiai mérési folyamatok által nyert adatok kiváló feldolgozása legalább olyan fontos, mint az adatok megszerzése. Sok kiváló kutatólaboratórium remek munkát végez az előbbiben, és minősíthetetlenül rosszat az utóbbiban. Ezért hiába sok drága nagyműszer, a technikusok, doktoranduszok és posztdoktorok munkaóráinak tízezrei, ha a sok mérési adatot nem megfelelő, nem hibatűrő (azaz robusztus), nem matematikailag igényes módszerekkel dolgozzák fel. Ebben az irányban fogunk a jelen projekt keretében fontos elmozdulást tenni.

A kutatás összefoglalója, célkitűzései laikusok számára
Ebben a fejezetben írja le a kutatás fő célkitűzéseit alapműveltséggel rendelkező laikusok számára. Ez az összefoglaló a döntéshozók, a média, illetve az érdeklődők tájékoztatása szempontjából különösen fontos az NKFI Hivatal számára.

A biológiában nap mint nap óriási mennyiségű mérési adat keletkezik. Ezek feldolgozása, tárolása, szűrése az élettudományi képzettségű kutatók számára nehéz, és ehhez az informatikai képzettségű kutatóknak is mély matematikai eszközökre van szüksége.

Jelen pályázat nagy biológiai hálózatok analízisére dolgoz ki új módszereket, matematikai megalapozottsággal. Pontosabban már ismert, de a biológiában még nem használt matematikai eszközöket alkalmazunk biológiai hálózatok elemezésére, illetve új matematikai eszközöket fejlesztünk ki erre a célra. A kifejlesztett eszközöknek robosztusaknak kell lenniük, mivel a biológiai hálózatok leírása általában sok hibát tartalmaz.
Summary
Summary of the research and its aims for experts
Describe the major aims of the research for experts.

Biological research generates an enormous quantity of data every single day. The storage, processing, filtering and the analysis of these data is difficult for life scientists, and the expert informaticians will also need deep mathematical tools to deal with these tasks. The basis of this proposal is a mathematical article (with 5 independent Scopus citations and 29 independent Google Scholar citations) that considers the very famous Google PageRank function, and the article proofs that it is a very rare situation when the PageRank of the vertices of the undirected graphs are proportional with the degree of the nodes. More exactly, the publication gives a necessary and sufficient condition when this happens. The main idea behind the spectacular rise of the Google Inc. is the early application of the PageRank function for ordering the hits of the Google search engine: the early Google gave back the hits with higher PageRank first. Therefore, the PageRank quantifies the most “important” nodes in a directed graph (the graph of the World Wide Web, or the Webgraph, in a certain sense. Since really many people use the Google search engine on a daily basis, this graph function has a great impact to our everyday life (in today’s implementations of the Google search engine, the role of the originally defined PageRank function is not clear, the exact construction of the search engine is a trade secret today).

In the present proposal we will apply new, robust methods for the analysis of biological networks. The robustness is an important point since most biological data contain lots of errors, inherited from the measurement methods.

What is the major research question?
Describe here briefly the problem to be solved by the research, the starting hypothesis, and the questions addressed by the experiments.

What kind of mathematical graph properties can be applied in the description of the biological properties of different biologically relevant networks? In answering this question we intend to apply more mathematics and less “network science”. In our previous works we have demonstrated the applicability of the versions of the PageRank function of Google; we would like to further develop this line of investigation in the present project.

What is the significance of the research?
Describe the new perspectives opened by the results achieved, including the scientific basics of potential societal applications. Please describe the unique strengths of your proposal in comparison to your domestic and international competitors in the given field.

The well-developed, high-throughput biological measurement processes yield a high amount of data. The high-quality processing of the data acquired is as important as the measuring process itself. There are many good laboratories with good experimental but bad data analysis capabilities. Therefore, the expensive research infrastructure and the work-hours of thousands of personnel go with very low results if the quality of the data processing is low, it is not robust, it cannot handle the intrinsic error sources of the measurement processes. The present project will help the biological data processing in the improvement and/or introduction of mathematical methods, capable to address these challenges.

Summary and aims of the research for the public
Describe here the major aims of the research for an audience with average background information. This summary is especially important for NRDI Office in order to inform decision-makers, media, and others.

Biological research generates an enormous quantity of data every single day. The storage, processing, filtering and the analysis of these data is difficult for life scientists, and the expert informaticians will also need deep mathematical tools to deal with these tasks.

In the present proposal we will apply new, robust methods for the analysis of biological networks. The robustness is an important point since most biological data contain lots of errors, inherited from the measurement methods.





 

Final report

 
Results in Hungarian
Biológiai gráfok matematikai elemzésében értünk el kimagasló eredményeket: több új, úttörő módszert dolgoztunk ki ezen gráfok megbízható, hibatűrő, robusztus elemzésére, és ezekkel a módszerekkel alapvető eredményeket értünk el. Publikációs teljesítményünk a két projektév alatt: 12 folyóiratcikk, kumulatív impakt faktor: 35.455 Publikáltunk többek közt a Bioinformatics és a Scientific Reports c. lapokban is. Sajtóvisszhang: számos televízió, rádió-interjú, és sok megjelenés az index.hu, origo.hu, hirado.hu és egyéb portálokon.
Results in English
We have gained excellent results in the mathematical analysis of biological graphs: several new and pioneering methods were developed for the robust, relaible and low-error analysis of these graphs. We have reached fundamental results with the new methods. Publications in the 2-year project: 12 journal articles with cumulatic impact factor of 35.455; we have published in Bioinformatics and the Scientific Reports journals, among others. Press appearances: numerous TV- and radio interviews and several reports on nationwide news portals, like index.hu, origo.hu, hirado.hu, etc.
Full text https://www.otka-palyazat.hu/download.php?type=zarobeszamolo&projektid=126472
Decision
Yes





 

List of publications

 
Balázs Szalkai, Bálint Varga, Vince Grolmusz: Comparing Advanced Graph-Theoretical Parameters of the Connectomes of the Lobes of the Human Brain,, Cognitive Neurodynamics, Vol. 12, No. 6, pages 549-559 (2018), 2018
Kristóf Takács, Bálint Varga, Vince Grolmusz: PDB_Amyloid: An Extended Live Amyloid Structure List from the PDB, FEBS Open Bio, 2018. First published: 19 September 2018, 2018
Balázs Szalkai, Bálint Varga, Vince Grolmusz: Mapping Correlations of Psychological and Connectomical Properties of the Dataset of the Human Connectome Project with the Maximum Spanning Tree Method, Brain Imaging and Behavior, available online August 7, 2018, 2018
Balázs Szalkai, Vince Grolmusz: MetaHMM: A Webserver for Identifying Novel Genes with Specified Functions in Metagenomic Samples, Genomics, available online May 23, 2018, 2018
Balázs Szalkai, Vince Grolmusz: Human Sexual Dimorphism of the Relative Cerebral Area Volumes in the Data of the Human Connectome Project, European Journal of Anatomy, Vol. 22, No. 3. pp. 221-225 (2018), 2018
Balázs Szalkai, Vince Grolmusz: SECLAF: A Webserver and Deep Neural Network Design Tool for Hierarchical Biological Sequence Classification, Bioinformatics, Vol 34, No. 14, pp. 2487-2489 2018, 2018
Csaba Kerepesi, Bálint Varga, Balázs Szalkai, Vince Grolmusz: The Dorsal Striatum and the Dynamics of the Consensus Connectomes in the Frontal Lobe of the Human Brain, Neuroscience Letters, Vol. 673, (2018), pp. 51-55, 2018
Balázs Szalkai, Bálint Varga, Vince Grolmusz: The Robustness and the Doubly-Preferential Attachment Simulation of the Consensus Connectome Dynamics of the Human Brain, Scientific Reports, Vol. 7, 16118, 2017
Csaba Kerepesi, Balázs Szalkai, Bálint Varga, Vince Grolmusz: Comparative Connectomics: Mapping the Inter-Individual Variability of Connections within the Regions of the Human Brain, Neuroscience Letters Vol. 662, pp. 17-21, (2018), 2018
Kristóf Takács, Bálint Varga, Vince Grolmusz: PDB_Amyloid: An Extended Live Amyloid Structure List from the PDB, FEBS Open Bio, Vol. 9, No. 1. pp. 185-190, 2019, 2019
Balázs Szalkai, Bálint Varga, Vince Grolmusz: Mapping Correlations of Psychological and Connectomical Properties of the Dataset of the Human Connectome Project with the Maximum Spanning Tree Method, Brain Imaging and Behavior, Vol. 13, No. 5, pp. 1185-1192 (2019), 2019
Balázs Szalkai, Vince Grolmusz: MetaHMM: A Webserver for Identifying Novel Genes with Specified Functions in Metagenomic Samples, Genomics, Vol. 111, No. 4, pp. 883-885, (2019), 2019
Máté Fellner, Bálint Varga, Vince Grolmusz: The Frequent Network Neighborhood Mapping of the Human Hippocampus Shows Much More Frequent Neighbor Sets in Males Than in Females, PLOS ONE 15(1): e0227910 (2020), 2020
Máté Fellner, Bálint Varga, Vince Grolmusz: The Frequent Subgraphs of the Connectome of the Human Brain, Cognitive Neurodynamics Vol. 13, No. 5, pp. 453-460 (2019), 2019
Balázs Szalkai, Csaba Kerepesi, Bálint Varga, Vince Grolmusz: High-Resolution Directed Human Connectomes and the Consensus Connectome Dynamics, PLOS ONE, Vol. 14 No. 4,: e0215473 (2019), 2019
L.Keresztes, E.Szögi, B.Varga, V.Grolmusz: Identifying Super-Feminine, Super-Masculine and Sex-Defining Connections in the Human Braingraph, arXiv preprint arXiv:1912:02291, 2019
L.Keresztes, E.Szögi, B.Varga, V.Grolmusz: Identifying Super-Feminine, Super-Masculine and Sex-Defining Connections in the Human Braingraph, arXiv preprint arXiv:1912:02291, 2019




Back »