Observing, understanding, and exploiting collision energy dependence of the fragmentation of N-glycopeptides: Large-scale studies  Page description

Help  Print 
Back »

 

Details of project

 
Identifier
132135
Type PD
Principal investigator Rokobné Révész, Ágnes
Title in Hungarian N-glikopeptidek energiafüggő fragmentációjának széleskörű vizsgálata: Megfigyelés, megértés, alkalmazás
Title in English Observing, understanding, and exploiting collision energy dependence of the fragmentation of N-glycopeptides: Large-scale studies
Keywords in Hungarian tömegspektrometria, LC-MS/MS, glikoproteomika, poszttranszlációs módosítás, ütközési energia, Mascot pontszám, Byonic pontszám, fragmentáció, adatfeldolgozás
Keywords in English mass spectrometry, LC-MS/MS, glycoproteomics, post-translational modification, collision energy, Mascot score, Byonic score, fragmentation, data processing
Discipline
Analytical Chemistry (Council of Physical Sciences)70 %
Ortelius classification: Instrumental analysis
Physical Chemistry and Theoretical Chemistry (Council of Physical Sciences)30 %
Ortelius classification: Physical chemistry
Panel Chemistry 1
Department or equivalent Institute of Organic Chemistry (Research Center of Natural Sciences)
Starting date 2019-12-01
Closing date 2022-11-30
Funding (in million HUF) 25.500
FTE (full time equivalent) 2.40
state closed project
Summary in Hungarian
A kutatás összefoglalója, célkitűzései szakemberek számára
Itt írja le a kutatás fő célkitűzéseit a témában jártas szakember számára.

A glikoziláció az egyik legfontosabb poszt-transzlációs módosítás, kulcsszerepet játszik számos biokémiai folyamatban. Vizsgálatának az utóbbi években elengedhetetlen eszközévé vált a folyadékkromatográfiával kapcsolt tömegspektrometria. A glikoziláció tanulmányozása a glikoproteinek kis koncentrációja és a glikánszerkezetek nagyfokú heterogenitása miatt kihívásokkal teli, így a kísérleti paraméterek, különösen az ütközésindukált disszociációs (CID) kísérletekben használt ütközési energia, optimális megválasztása esszenciális. Jelen projektnek 3 fő célja van. Egyrészt LC-MS/MS vizsgálatokkal fel fogjuk térképezni N-glikopeptidek esetén az adatbázis keresés megbízhatóságának, valamint a glikánfragmensek és peptidfragmensek intenzitásának energiafüggését, a korábbiaknál részletesebben és nagyobb számú N-glikopeptid vizsgálatával. Vizsgálatainkat többféle keresőmotorral (Mascot, Byonic, ProteinScape, ProteinProspector) is elvégezzük, és különféle szempontból optimális ütközési energiákat határozunk majd meg. Másrészt, a létrejövő nagy adathalmaz lehetővé teszi a fragmentáció mélyebb megértését, és az optimumok szerkezeti jellemzőktől való függésének vizsgálatát statisztikai módszerekkel, vagy akár gépi tanulással. Harmadrészt, az adatokat felhasználjuk majd arra, hogy jobb MS-alapú analízismódszereket fejlesszünk, melyek optimális paramétereket használnak az online elérhető tulajdonságok (pl. teljes tömeg, töltés, intenzitás, glikán és peptid tömeg, stb.) figyelembevételével. A CID elektron-transzfer-disszociációval (ETD) való kombinálásából származó előnyöket is megvizsgáljuk, mind az egyes glikopeptidek, mind egy komplex minta teljes analízisének szemszögéből.

Mi a kutatás alapkérdése?
Ebben a részben írja le röviden, hogy mi a kutatás segítségével megválaszolni kívánt probléma, mi a kutatás kiinduló hipotézise, milyen kérdéseket válaszolnak meg a kísérletek.

Alacsony koncentrációjuknak és szerkezeti heterogenitásuknak köszönhetően a glikoproteinek vizsgálata kihívásokkal teli. Glikoproteomikai mérések során ezért esszenciális a kísérleti paraméterek megválasztása. Ezeken múlik ugyanis a mérések hatékonysága, amit az azonosított glikopeptidek számával, az azonosítási pontszámokkal, vagy a glikán és peptid fragmensionok számával is jellemezhetünk. Az optimális paraméterek a glikopeptid tulajdonságaitól és szerkezetétől is függhetnek. A glikoproteomikai mérések hatékonyságát ezen túlmenően egy kísérleten belül többféle fragmentációs technika vagy paraméterérték kombinálásával is növelhetjük. Jelen pályázat célja az optimális paraméterek és szerkezetfüggésük meghatározása különféle célváltozók mellett. A következő kérdésekre keressük a választ: Hogyan függ a glikopeptid pontszáma vagy szekvencialefedettsége az ütközési energiától? Hogyan függ az optimális ütközési energia a töltésállapottól, az m/z értéktől, a peptid és glikánrész tömegétől, a sziálsavak számától, az aminosav és glikánösszetételtől, a koncentrációtól stb.? Összefüggésbe hozható azonosítás nélkül is hozzáférhető tulajdonságokkal? Hogyan befolyásolja a viselkedést a fragmentációs technika? Milyen mértékben növelhető az azonosított glikopeptidek vagy a fragmensiontípusok száma a különböző fragmentációs technikák vagy beállítások kombinálása által? A fenti kérdések sikeres megválaszolásával jobban megérthetjük a glikopeptidek fragmentációs viselkedését és hozzájárulhatunk a glikopeptid azonosítás módszereinek jelentős fejlődéséhez.

Mi a kutatás jelentősége?
Röviden írja le, milyen új perspektívát nyitnak az alapkutatásban az elért eredmények, milyen társadalmi hasznosíthatóságnak teremtik meg a tudományos alapját. Mutassa be, hogy a megpályázott kutatási területen lévő hazai és a nemzetközi versenytársaihoz képest melyek az egyediségei és erősségei a pályázatának!

A tömegspektrometria alapú glikoproteomikai mérések hatékonysága függ a fragmentációs technikától, és a kísérleti paraméterektől, így különösen az ütközési energiától. A paraméterek optimális értéke változhat attól függően, hogy mit értünk a módszer hatékonysága alatt (keresőmotor által adott pontszám, azonosított glikopeptidek száma, fragmensionfajták száma), ill. a bottom-up megközelítésben a vizsgált speciesz tulajdonságaitól is (pl. a peptidszekvenciától és a glikánszerkezettől). A választott keresőmotornak is nagy szerepe lehet, mivel a jelenleg használt szoftverek nagyon különböző annotálási és pontozási algoritmusokat használnak. Jelen projekt célja ezeknek az összefüggéseknek a feltárása szisztematikus kísérletekkel. A projekt egyedi erőssége, hogy az energiától és fragmentációs technikától való függést részletesen és közvetlenül a proteomikára jellemző változókra vizsgáljuk, így például az adatbáziskeresésen alapuló azonosítási pontszámra, igen nagy számú peptid és glikánstruktúra esetére. Saját fejlesztésű bioinformatikai eszközök használata révén sok kísérleti adatot fogjuk feldolgozni egyidejűleg, automatizált formában. Az eredményeket összefüggésbe hozzuk a glikopeptidek tulajdonságaival. A projekt újdonságának tekinthető, hogy olyan tulajdonságokat is tanulmányozunk majd, melyek egy előzetes MS/MS-ből azonosítás nélkül megállapíthatók (pl. a peptid és cukorrész tömege, sziálsavak jelenléte/száma). Megvizsgáljuk majd, mely kísérleti paraméterek vezetnek a leginformatívabb előzetes MS/MS-hez. Mindezek által jobban megérthetjük a glikopeptidek fragmentációját, és konkrét biokémiai alkalmazások számára jobb analízismódszereket fejleszthetünk ki. Továbbá, vizsgáljuk többféle fragmentációs technika együttes alkalmazásának használt, optimáljuk annak körülményeit, és ezeket is összekapcsoljuk a glikopeptidek tulajdonságaival.

A kutatás összefoglalója, célkitűzései laikusok számára
Ebben a fejezetben írja le a kutatás fő célkitűzéseit alapműveltséggel rendelkező laikusok számára. Ez az összefoglaló a döntéshozók, a média, illetve az érdeklődők tájékoztatása szempontjából különösen fontos az NKFI Hivatal számára.

A glikoproteinek olyan fehérjék, melyekhez cukoregységek is kapcsolódnak. Számos biokémiai folyamatban kulcsszerepet játszanak. Minőségi és mennyiségi meghatározásuk egy komplex mintából ijesztően nagy feladat, különösen alacsony koncentrációjuk és heterogenitásuk miatt. Ugyanakkor nagy gyakorlati jelentőséggel is bír, például a gyógyszerfejlesztést elősegítő biokémiai vizsgálatokban vagy az orvosi diagnosztikában. A folyadékkromatográfiával kapcsolt tömegspektroszkópia hatalmas fejlődésen ment keresztül az utóbbi években, így manapság igen gyakran ezt a technikát alkalmazzák erre a feladatra. A hatékony mérési módszerek megkövetelik többféle kísérleti megközelítés megfelelő kombinálását és számos paraméter finomhangolását. Jelen projekt célja a mérések hatékonysága, valamint a kísérleti paraméterek és a glikopeptidek (a glikoproteinek kis darabjai) jellemzői közötti összefüggések feltérképezése. Ennek érdekében szisztematikus kísérletsorozatokat és saját fejlesztésű bioinformatikai eszközöket tervezünk használni. A várható eredmények új betekintést nyújthatnak a glikopeptidek fizikai kémiai viselkedésébe, és jobb protokollok kidolgozásának alapjául szolgálhatnak. Ezáltal a pályázat eredményei hozzájárulhatnak a gyógyszeripari, diagnosztikai és orvosbiológiai módszerek fejlődéséhez.
Summary
Summary of the research and its aims for experts
Describe the major aims of the research for experts.

Glycosylation is one of the most important post-translational modifications, playing key role in several biochemical processes. In its studies, mass spectrometry (MS) coupled to liquid chromatography (LC) has become an indispensable analytical tool. Analysis of glycosylation is challenging due to the low concentration of glycoproteins and heterogeneity of glycan structures; therefore, optimal instrument settings, especially the choice of collision energy in collision-induced dissociation (CID) are critical. The aim of the present proposal is threefold. First, LC-MS/MS studies will be carried out to map the energy-dependent behavior of various N-glycopeptide database search identification scores, as well as glycan and peptide fragment ion abundances, for an unprecedentedly large number of N-glycopeptides with high granularity. Several common search engines (Mascot, Byonic, ProteinScape, ProteinProspector) will be studied, and energies optimal with respect to various criteria will be determined. Second, utilizing the unique opportunity provided by this large database, we aim at deepening the understanding of fragmentation by linking the optima to structural properties, with simple statistical, or possibly machine learning, techniques. Third, we will exploit the data to formulate enhanced MS-based analysis workflows, based on optimal parameters as function of online accessible properties, e.g., total mass, charge, intensity, glycan and peptide mass, etc. Benefits from the combination of CID with complementary electron-transfer-dissociation experiments will also be explored both as a function of analyte structure and as a global approach in the analysis of a complex sample.

What is the major research question?
Describe here briefly the problem to be solved by the research, the starting hypothesis, and the questions addressed by the experiments.

The analysis of glycoproteins is challenging due to their low concentration and heterogeneity of the glycan structure. Therefore, the choice of experimental parameters within a glycoproteomics measurement is critical. The efficiency of the measurements given by the number of identified glycopeptides, their scores, or the number of glycan of peptide fragment ions depends significantly on the instrument settings. The optimal settings may depend on glycopeptide properties and structure. Involving various fragmentation techniques or multiple settings within the same experiment can also improve the glycoproteomics methodology. The present proposal aims to determine the optimal selection for various target variables and its relationship to properties, by performing and analyzing systematic experimental studies. Questions to be answered include: How do glycopeptide score or sequence coverage depend on collision energy? Does it depend on the search engine used for data analysis? How is the optimal energy related to glycopeptide m/z, charge, mass ratio of the peptide and glycan part, number of sialic acids, amino acid and glycan composition, concentration etc.? Can it be linked to properties available without identification? How does the fragmentation technique influence the behavior? How much gain in the number of identified glycopeptides/number of different types of fragment ions can be obtained from combining different fragmentation techniques or settings within the experiment? Successful answers to these questions can enhance our understanding of glycopeptide fragmentation behavior and notably contribute to the improvement of glycopeptide identification workflows.

What is the significance of the research?
Describe the new perspectives opened by the results achieved, including the scientific basics of potential societal applications. Please describe the unique strengths of your proposal in comparison to your domestic and international competitors in the given field.

In mass spectrometry based glycoproteomics, measurement efficiency depends on the fragmentation technique and experimental parameters, especially on collision energy. Their optimal choice varies with the chosen measure of efficiency (e.g., search engine score, number of identified glycopeptides, number of different types of fragment ions) and, in a bottom-up approach, with the characteristics of the analytes (e.g., sequence of peptide backbone, glycan structure). Also the search engine used may have a huge effect, because the currently used data analysis programs have largely different annotation and scoring algorithms. The present proposal aims at the characterization of these dependencies by systematic sets of experiments. Specific strength of this project is that energy and fragmentation technique dependence is mapped granularly and directly for high-level proteomics variables such as database search identification scores of glycopeptides for an unprecedentedly large number of peptide and glycan structures. Via the application of in-house developed bioinformatics tools for the processing of sets of experiments, large data sets will be processed simultaneously in automated fashion. These results will be linked to glycopeptide properties. Another novelty is that we also take into account several characteristics that may be determined from a short, preliminary MS/MS spectrum without identification (e.g., mass of peptide part, mass of glycan part, presence/number of sialic acids). The experimental settings giving the most informative preliminary MS/MS will be also studied. These will enhance our understanding on glycopeptide fragmentation and can lead to methodological advances for specific biochemical applications. Further, the combined use of different fragmentation techniques will be optimized and its usefulness will also be linked to the glycopeptide properties.

Summary and aims of the research for the public
Describe here the major aims of the research for an audience with average background information. This summary is especially important for NRDI Office in order to inform decision-makers, media, and others.

Glycoproteins are proteins with attached sugar units and have key roles in many biochemical processes. Their identification and characterization within a complex sample is a daunting task, especially due to their low concentration and heterogeneity. On the other hand, it is also of practical importance, e.g., in biochemical studies underlying drug development, and in medical diagnostics. Mass spectrometry, coupled to liquid chromatography, has undergone notable development, and it is now very often the tool of choice to meet this challenge. Efficient measurements require the proper combination of the used technologies and fine tuning of numerous experimental parameters. The present project aims to map relationships among measurement efficiency and experimental parameters, as a function of properties of glycopeptides (small pieces of glycoproteins). Systematic experiments and in-house developed bioinformatics tools will be used to achieve this goal. The expected results enhance our knowledge about the physical chemistry of the glycopeptides and may serve as a basis for the development of better methodologies for pharmaceutical, diagnostics, and biomedical applications.





 

Final report

 
Results in Hungarian
A fehérjék poszttranszlációs módosításai, különösen a glikoziláció, alapvető biológiai szerepet játszanak; analitikájuk ezért döntő fontosságú mind az élettudományi kutatások, mind a biológiai gyógyszerek fejlesztése szempontjából. Projektünk tágabb értelemben vett célja a tandem tömegspektrometriában rejlő lehetőségek maximális kiaknázása volt, ezen belül konkrétan az N-glikopeptidek analíziséhez szükséges optimális ütközési energia leírásával és megértésével foglalkoztunk. Ez a spektrumok információtartalmát, ezáltal az azonosítás sikerét meghatározó legfontosabb paraméter. Számos méréssorozatot hajtottunk végre ennek a paraméternek a változtatásával, keresve a maximális pontszámot különböző adatfeldolgozó szoftverek esetében, minden eddiginél nagyobb számú glikopeptidre. Standard statisztikai és gépi tanulási módszereket alkalmaztunk, hogy azonosítsuk a peptid és a glikánrész jellemzőinek az optimumra gyakorolt hatását. Az eredmények alapján munkafolyamatokat dolgoztunk ki, melyekkel az azonosított glikopeptidek számának jelentős növekedését értük el az irodalmi módszerekhez képest. Rávilágítottunk a tömegspektrometriai platformok (például QTof és Orbitrap) közötti hasonlóságokra és különbségekre, és javasoltunk egy referencia-peptid alapú protokollt, amellyel gyorsan átvihetők az optimalizált beállítások egyik műszerről a másikra. Eredményeink a glikopeptid fragmentáció megértéséhez és jobb gyakorlati analitikai módszerek kidolgozásához egyaránt hozzájárulnak.
Results in English
Post-translational modifications, and in particular, glycosylation of proteins, play essential biological roles; their analysis is therefore of crucial importance for both life science research and biological drug development purposes. In this project, we worked towards exploiting the full potential of tandem mass spectrometry in this context; specifically, to describe and understand the optimal collision energy settings for N-glycopeptides. This parameter is the most important one determining information content of spectra, thereby the success of identification. We carried out many sets of measurements varying this parameter and looked for the maximum of identification scores by various data processing software for an unprecedentedly large set of glycopeptides. We used standard statistical methods and a few machine learning approaches to identify the influence of peptide and glycan characteristics on the optimum. We developed workflows based on the results and confirmed them to yield significant increases in number of identified species as compared to literature methods. We demonstrated similarities and differences between mass spectrometric platforms (e.g., QTof and Orbitrap) and proposed a reference-peptide-based protocol that can be used to quickly transfer optimized settings from one instrument to another. Our results contribute both to the understanding of glycopeptide fragmentation and to the development of high-performance practical analytical methods.
Full text https://www.otka-palyazat.hu/download.php?type=zarobeszamolo&projektid=132135
Decision
Yes





 

List of publications

 
Hevér, H.; Nagy, K.; Xue, A.; Sugár, S.; Komka, K.; Vékey, K.; Drahos, L.; Révész, Á.: Diversity Matters: Optimal Collision Energies for Tandem Mass Spectrometric Analysis of a Large Set of N-Glycopeptides., J. Proteome Res. 2022, 21 (11), 2743–2753, 2022
Ágnes Révész*, Márton Gyula Milley, Kinga Nagy, Dániel Szabó, Gergő Kalló, Éva Csősz, Károly Vékey, László Drahos: Tailoring to Search Engines: Bottom-Up Proteomics with Collision Energies Optimized for Identification Confidence, Journal of Proteome Research, 2021, 20 (1), 474–484, 2021
Bugyi, Fanni; Szabó, Dániel; Szabó, Győző; Révész, Ágnes; Vékey, Károly; Drahos, László: Influence of post-translational modifications on protein identification in database searches, ACS Omega, 2021, 6, 7469–7477, 2021
Dániel Szabó, Gitta Schlosser, Károly Vékey, László Drahos, Ágnes Révész*: Collision energies on QTof and Orbitrap instruments: How to make proteomics measurements comparable?, Journal of Mass Spectrometry, 2021, 56, e4693, 2021
Révész Ágnes*, Hevér Helga, Steckel Arnold, Schlosser Gitta, Szabó Dániel, Vékey Károly, Drahos László: Collision energies: Optimization strategies for bottom‐up proteomics, MASS SPECTROMETRY REVIEWS, Paper: e21763, 2021
Kinga Nagy, Helga Hevér, Andrea Xue, Simon Sugár, Károly Vékey, Kinga Komka, László Drahos, Ágnes Révész: Optimization of mass spectrometric measurement and evaluation method for the identification of N-glycopeptides, Konferencia poszter, XIV Annual Congress of the European Proteomic Association, 3–7 April 2022 Leipzig, 2022
Agnes Revesz, Laszlo Drahos, Karoly Vekey, Kinga Nagy, Gitta Schlosser: Collision energy setting in proteomics and glycoproteomics: From individual species to a practical perspective, konferencia poszter, 16th Central and Eastern European Proteomic Conference, Prague, Czech Republic, 2022
Schultzné Xue Andrea: Mérési és kiértékelési módszerek fejlesztése N-glikoproteinek bottom-up vizsgálatához, BME VBK MSc diplomamunka, 2022
Sándor Péter: Mérési és kiértékelési módszerek fejlesztése nem-triptikus peptidek bottom-up vizsgálatára, BME VBK MSc diplomamunka, 2022
Ágnes Révész*, Márton Gyula Milley, Kinga Nagy, Dániel Szabó, Gergő Kalló, Éva Csősz, Károly Vékey, László Drahos: Tailoring to Search Engines: Bottom-Up Proteomics with Collision Energies Optimized for Identification Confidence, Journal of Proteome Research, 2020
Dániel Szabó, Gitta Schlosser, Károly Vékey, László Drahos, Ágnes Révész*: Collision energies on QTof and Orbitrap instruments: How to make proteomics measurements comparable?, Journal of Mass Spectrometry, 2020
Bugyi, Fanni; Szabó, Dániel; Szabó, Győző; Révész, Ágnes; Vékey, Károly; Drahos, László: Influence of post-translational modifications on protein identification in database searches, submitted to ACS Omega, 2021
Nagy Kinga: Glikopeptidek mérési és kiértékelési módszerének optimalizálása, ELTE TTK Videó Verseny - TDK videó, 2020
Bugyi, Fanni; Szabó, Dániel; Szabó, Győző; Révész, Ágnes; Vékey, Károly; Drahos, László: Influence of post-translational modifications on protein identification in database searches, ACS Omega, 2021, 6, 7469–7477, 2021
Révész Ágnes*, Hevér Helga, Steckel Arnold, Schlosser Gitta, Szabó Dániel, Vékey Károly, Drahos László: Collision energies: Optimization strategies for bottom‐up proteomics, MASS SPECTROMETRY REVIEWS, Paper: e21763, 2021
Nagy Kinga: Tömegspektrometriás mérési és kiértékelési módszerek optimalizálása N-glikopeptidek azonosítására, ELTE TTK MSc diplomamunka, 2021
Schultzné Xue Andrea: Mérési és kiértékelési módszerek fejlesztése N-glikoproteinek bottom-up vizsgálatához, BME VBK MSc diplomamunka - védés várhatóan 2022 elején, 2022




Back »