Diagnostic possibilities of speech disorders caused by abnormal speech-forming organ lesions, neurological and psychiatric disorders using artificial intelligence  Page description

Help  Print 
Back »

 

Details of project

 
Identifier
128568
Type K
Principal investigator Vicsi, Klára
Title in Hungarian Kóros beszédképzőszervi, idegi és pszichiátriai elváltozások okozta beszéd eltérések diagnosztizálási lehetőségei mesterséges intelligencia segítségével
Title in English Diagnostic possibilities of speech disorders caused by abnormal speech-forming organ lesions, neurological and psychiatric disorders using artificial intelligence
Keywords in Hungarian beszéd mint biosignal, beszédparaméterek, organikus és funkcionális beszédzavar, Parkinson kór, statisztikai elemzés, automatikus osztályozás, mesterséges intelligencia
Keywords in English speech as a biosignal, non-verbal speech parameters, organic and functional speech disorder, Parkinson’s disease, statistical analysis, automatic classification , artificial intelligence
Discipline
Medical engineering and technology (Council of Medical and Biological Sciences)40 %
Linguistics (Council of Humanities and Social Sciences)30 %
Ortelius classification: Phonetics
Information Technology (Council of Physical Sciences)30 %
Ortelius classification: Medical informatics
Panel Informatics and Electrical Engineering
Department or equivalent Department of Telecommunications and Media Informatics (Budapest University of Technology and Economics)
Participants Jenei, Attila Zoltán
Kiss, Gábor
Mészáros, Krisztina
Mészáros, Zoltán
Simon, Lajos
Sztahó, Dávid
Tulics, Miklós Gábriel
Valálik, István
Starting date 2018-10-01
Closing date 2022-09-30
Funding (in million HUF) 35.928
FTE (full time equivalent) 12.75
state closed project
Summary in Hungarian
A kutatás összefoglalója, célkitűzései szakemberek számára
Itt írja le a kutatás fő célkitűzéseit a témában jártas szakember számára.

A kutatás fő célja, hogy feltárjuk, hogy az emberek fiziológiai, pszichológiai és neurológiai állapota hogyan tükröződik a beszéd akusztikai-fonetikai paramétereiben. Azokat a beszédben meglévő, mérhető jellemzőket keressük, amelyek jelzik a hangképzőszervi, valamint idegi kóros elváltozások egyes típusait és mértékét. Módszerünk a beteghanganyag jelfeldolgozásán alapuló statisztikai elemzés és gépi tanulás alkalmazása. Kutatásunk eredménye a hangképzésről megalkotott fiziológiai és fonetikai tudásunk elmélyítése, valamint a megszerzett tudás alapján olyan műszaki megoldás kidolgozása, amely képes a beszédben előforduló rendellenességek automatikus detektálására, valamint a rendellenesség változásának a követésére. Ehhez különböző jelfeldolgozási, lényegkiemelő eljárásokat, valamint mesterséges intelligencia technikákat alkalmazó osztályozási és regressziós módszereket alkalmazunk, megteremtve egy új diagnosztikai eljárás alapjait. Három betegségcsoportot kívánunk megvizsgálni: (i) hangképző szervek kóros elváltozásai (a gége rákos daganata, polip, vagy hangszalagbénulás, stb.); (ii) depressziós állapotú személyek beszédének vizsgálata; (iii) neurodegeneratív betegségek (Parkinson-kór).
A kinyert (hagyományos jelfeldolgozáson és mély neurális hálókon alapuló) akusztikai-fonetikai jellemzők és a rájuk épített gépi tanuláson alapuló diagnosztikai modell osztályozási teljesítményének mérése alapján elkészítünk egy, az adott betegségeket adott pontossággal (egyidejűleg) detektálni képes rendszert, valamint kidolgozzuk a hozzá szükséges hangfelvételi protokollt. Parkinson-kór esetén az eljárást kiterjesztjük okostelefonnal való kézmozgásból számolt jellemzőkkel.

Mi a kutatás alapkérdése?
Ebben a részben írja le röviden, hogy mi a kutatás segítségével megválaszolni kívánt probléma, mi a kutatás kiinduló hipotézise, milyen kérdéseket válaszolnak meg a kísérletek.

A kutatás alapkérdése, hogy van-e bármilyen tipikus akusztikai-fonetikai paramétercsoport, amely a létrehozott beszédben tükrözi a hangképző szervek elváltozásait, vagy a beszélő depressziós állapotát? Létrehozhatók-e olyan műszaki orvosi döntéstámogató megoldások, amelyek a beszéd jelfeldolgozása alapján automatikusan detektálni tudják a kóros hangképzőszervi elváltozásokat, vagy olyan pszichológiai, idegi károsodásokat, mint például a depresszió, Parkinson-kór?
Hipotézis: A hangképző szervek elváltozásai, valamint az idegi eredetű betegségek főként a hangforrás (pl.zöngeképzés) és a hangképző üregek akusztikai-fonetikai paramétereiben(szegmentális szint) okoznak változást, a depresszió pedig főként a beszélő prozódiai paramétereiben tükröződik(szupra-segmentális szint), mint például hangsúly, intonáció, vokalizálás/szünet arány, és ritmus.
A rendellenes beszéd statisztikai vizsgálatára a folyamatos beszéd lényegesen alkalmasabb, mint az eddig főként vizsgált kitartott magánhangzók. A folyamatos beszéd statisztikai akusztikai vizsgálatai alapján lehetséges azoknak az akusztikai-fonetikai paramétereknek a kiválasztása, amelyek alapján különbséget tehetünk normál és hibás beszéd, valamint az egyes betegségek között, továbbá az egyes betegségek súlyossága osztályozható. Kialakíthatók olyan lényegkiemelő és AI típusú osztályozó eljárások, amelyek alkalmazásával újfajta diagnosztikai eljárások (automatikus orvosi döntéstámogató rendszerek) hozhatók létre. A Parkinson-kór esetén kutatjuk, hogy a kéz mozgásának koordinálásában végbemenő abnormalitás mérhető-e okos telefon mozgásérzékelőjével, és ez az információ felhasználható-e a betegség súlyossági fokának meghatározására.

Mi a kutatás jelentősége?
Röviden írja le, milyen új perspektívát nyitnak az alapkutatásban az elért eredmények, milyen társadalmi hasznosíthatóságnak teremtik meg a tudományos alapját. Mutassa be, hogy a megpályázott kutatási területen lévő hazai és a nemzetközi versenytársaihoz képest melyek az egyediségei és erősségei a pályázatának!

A projekt keretén belül néhány mondat bemondása alapján azonnali eredményt adó, nem invazív orvosi döntéstámogató rendszerek alapjait kívánjuk megteremteni.
Konkrétan három orvos diagnosztikai támogató rendszer alapjainak a lefektetését vállaljuk:
(1) a hangképzési rendellenesség diagnosztizálása (pl. a korai stádiumban lévő rákos elváltozások a gégében), segítve a háziorvosok, klinikai orvosok valamint a terapeuták munkáját; (2) depressziót diagnosztizáló módszer a depresszió súlyosságának jelzésére és a kezelés követésére; (3) a Parkinson-kórt és annak súlyossági fokát detektáló hang-, és kézremegésen alapuló diagnosztikai rendszer.
Kutatásunknak valójában három tudományterületen van nagy jelentősége. A nyelvészet, szorosabban véve a fonetika területén a hangképzésről kialakított tudásunkat tudjuk bővíteni, elmélyíteni azzal, hogy egyrészt vizsgáljuk a hangképző szervi elváltozások hatását a beszédproduktum mérhető paramétereire, másrészt a depressziós beszéd normálistól eltérő viselkedésének vizsgálatával a hangképzés motorikus működését ismerjük meg a korábbinál mélyebben. Az orvostechnika és technológia, valamint a műszaki tudományok területén újat teremtünk azzal, hogy olyan diagnosztikai eszközök műszaki alapjait hozzuk létre, amelyek nem-invazív módon, képesek bizonyos betegségek felléptét, súlyosságát megbecsülni. Új beszédjel feldolgozó és osztályozó algoritmusok létrehozása várható, továbbá olyan algoritmusok kerülnek implementálásra, amelyek egy klinikai döntéstámogató rendszer működését biztosítják.
A beszéd, mint diagnosztikai eszköz (bio-marker) kutatása új kutatási terület, úgynevezett „hot topic”. A jelentősebb kutatóhelyek között erős verseny alakult ki. Már laboratóriumunk is ért el biztató kezdeti eredményeket mind a három diagnosztikai területen. Mivel beszéddetektálásról van szó, a módszernek vannak nyelvfüggő és nyelv-független összetevői. Nyelvfüggő fonetikai paraméterekkel lényegesen pontosabb eredmények várhatók, különösen a depresszió területén, mint nyelv-független megoldásokkal. Ezért társadalmilag és egészségügyileg is igen fontos a magyar nyelvre jól működő rendszerek alapjainak a megteremtése.

A kutatás összefoglalója, célkitűzései laikusok számára
Ebben a fejezetben írja le a kutatás fő célkitűzéseit alapműveltséggel rendelkező laikusok számára. Ez az összefoglaló a döntéshozók, a média, illetve az érdeklődők tájékoztatása szempontjából különösen fontos az NKFI Hivatal számára.

A beszéd az emberi kommunikáció egyik legfontosabb eszköze, amely a mondanivaló mellett a beszélőről számos információt tartalmaz. Ilyen például a beszélő neme, és az, hogy aki beszél, milyen fizikai, idegi állapotban van. Vannak olyan betegségek, amelyek megváltoztatják beszédünket. Ilyenek például a hangképzőszervi megbetegedések, a depresszió vagy a neurodegeneratív betegségek (pl. Parkinson-kór). A beszéd azon jellemzőit vizsgáljuk, amelyek jelzik, ha a beszédben a normálistól eltérő változás lépett fel. A kutatás segítésére hangképzőszervi rendellenességeket mutató beszédet tartalmazó adatbázisokat hozunk létre az Országos Onkológiai Intézetben, különböző súlyosságú depressziós beszédet tartalmazó adatbázist készítünk a SOTE Pszichiátriai és Pszichoterápiás Osztályán, valamint Parkinson-kóros beszédet rögzítünk a Szent János Kórházban. Az adatbázisok arra szolgálnak, hogy legyen elegendő mintánk a statisztikai feldolgozás és a különböző mesterséges intelligencia eszközöket alkalmazó osztályozási eljárások véghezvitelére. Eredményeink alapján olyan automatikus orvosi döntéstámogató rendszer hozható létre, amely rövid felolvasott szöveg alapján valószínűsíteni tudja, hogy az említett elváltozások fenn állnak-e, illetve ha igen, milyen súlyossággal. A beszédterápiák sikerességének automatikus megítélése is lehetővé válik, például egy gégeoperált, vagy egy gégeprotézist frissen viselő személy rehabilitációja során. A létrehozott diagnosztikai rendszerek alkalmasak a betegek szűrésére, emellett után-követésben, gondozásban nyújt segítséget a pszichiáterek, foniáterek, neurológusok és az alapellátásban dolgozó kollégák részére.
Summary
Summary of the research and its aims for experts
Describe the major aims of the research for experts.

The aim of the research is to explore how human physiological, psychological and neurological conditions are reflected in the acoustic-phonetic parameters of speech. Using a method based on statistical analysis of speech parameters and machine learning methods, we identify measurable speech characteristics that signal the type and severity of organic and functional speech disorders. As a result, with the expanded knowledge of the physiology and phonetics of phonation, we will establish the basics of a technique capable of detecting speech abnormalities and their changes over time automatically. This involves the use of various procedures for speech feature extraction, optimization and classification and regression methods utilizing artificial intelligence, resulting in the creation of a new diagnostic support tool. Three disease groups will be examined: (i) patients displaying pathological lesions in the speech organs (such as , malignant tumors in the throat, polyps and paralysis of the vocal cords); (ii) patients with depression; (iii) patients with Parkinson’s disease.
The extracted (using traditional signal processing and novel deep neural network based feature extraction) acoustic-phonetic features and the performance measurements of diagnostic model based on machine learning techniques will enable us to develop systems that can (simultaneously) detect and estimate the diseases with given certainty. A required sound recording protocol will also be established. In case of Parkinson’s disease, the method will be extended with hand movement information measured by smartphone accelerometer.

What is the major research question?
Describe here briefly the problem to be solved by the research, the starting hypothesis, and the questions addressed by the experiments.

The main questions are to determine: (a) whether, in a given speech sample, there is any typical acoustic-phonetic parameter set that reflects the presence of lesions in the speech organs, depression or Parkinson’s disease in the patient; and (b) whether a diagnostic support tool can be created that, solely by processing a speech sample, can automatically detect pathological lesions in the speech organs, neurotic conditions as depression or neurological diseases, such as Parkinson.
Hypothesis: lesions in the speech organs and neurological diseases result mainly in changes to acoustic-phonetic features of phonation and articulation (segmental level), whereas depression is more likely to be reflected in prosody parameters such as stress, intonation, vocalization/pause ratio and rhythm (supra-segmental level).
Continuous speech databases are considerably more suited for statistical examination of abnormal speech than steady vowel sounds utilized hitherto. Statistical acoustic examination of continuous speech enables the separation of acoustic-phonetic parameters in two important ways: (1) so that normal speech can be differentiated from abnormal speech (and different types of abnormal speech from each other), and (2) so that severity level of different diseases can be estimated. Using the latest feature extraction and AI model optimization techniques, a novel diagnostic support tool can be developed works by processing information found in speech.
In the case of Parkinson’s disease we examine if the abnormality of hand movement coordination could be measured by smartphone accelerometer and whether this information could be used to estimate the severity of the disease.

What is the significance of the research?
Describe the new perspectives opened by the results achieved, including the scientific basics of potential societal applications. Please describe the unique strengths of your proposal in comparison to your domestic and international competitors in the given field.

Within the framework of this project, we intend to create the basis of non-invasive medical decision support systems, based on reading a few sentences.
We are constructing three medical diagnostic support systems: (1) Laryngeal abnormality detector, which will signal the onset of problems with phonation (e.g. due to early stage of cancer in larynx), plus the probable origin of the problem. It could assist the work of GPs, clinicians and speech therapists. (2) Depression detector, which will estimate the severity of depression, and give and indicator measurement of the response to treatment. (3) Parkinson’s disease and its severity level detector based on speech and hand movement.
Our research is relevant in three disciplines. In the field of linguistics, more specifically phonetics, we can widen and deepen our knowledge of phonation by examining the effect of lesions in speech organs and neurological diseases (Parkinson) against measurable speech parameters and examining how the speech of people with depression differs from that of healthy people; here our understanding of the motoric operation of phonation will be deepened. In the field of medical engineering and technology as well as engineering sciences, we are creating new ones, by the development of such a novel diagnostic support tools that it will be able to determine the incidence and severity of certain diseases, in a non-invasive way. New speech processing and classifying algorithms are expected to be created, and algorithms will be implemented to ensure the operation of a clinical decision support system.
The research of speech as a diagnostic tool (biomarker) is novel field, so called ‘hot topic’. There has been a competition between major research institutes. Our laboratory has also achieved significant and promising initial results in all three disease detection fields. Like every other speech technology topics, the method in question also has language dependent and independent aspects. Using language dependent features, significantly better results could be achieved, especially in the case of depression. Thus, developing the basis of well performing systems based on Hungarian databases has outmost importance at social and healthcare fields.

Summary and aims of the research for the public
Describe here the major aims of the research for an audience with average background information. This summary is especially important for NRDI Office in order to inform decision-makers, media, and others.

Speech, which is one of the most important elements of human communication, reveals a wealth of information besides the actual content, for example, the speaker’s sex, as well as the state of his or her physical, neurological and mental health. Some illnesses affect speech, for example, diseases of the speech organs, depression and Parkinson’s disease. In the current proposal, we examine specifically those speech characteristics that reveal them. In order to provide sufficient samples for statistical analysis and to be able to apply various classification techniques involving the employment of artificial intelligence, with the help of the Head and Neck Surgical Department of the Hungarian National Oncology Institute, the Department of Psychiatry and Psychotherapy at Budapest Semmelweis University and the Department of Neurosurgery at St. John’s Hospital, Budapest, we create three speech databases: one consisting of people with abnormalities of the speech organs, one of people with various severities of depression and a third with the voice of patients with Parkinson’s disease. Based on our results, automatic diagnostic support tools could be developed, which will be able to detect the before mentioned diseases and estimate their severity by a short read text. It also enables the automatic assessment of treatment and rehabilitation successfulness, for example in case of patient recovering from laryngeal surgery or having recently been fitted with a prosthetic larynx. The developed method will be able to filter the patients. It will also provide assistance to psychiatrists, phoniatricians, neurologists and other clinicians involved in continuing care.





 

Final report

 
Results in Hungarian
A projekt során megvizsgáltuk a beszédképző szervekben bekövetkezett változások, valamint a beszédprodukció motoros funkcióját szabályozó egyes idegi folyamatok változásainak hatását a beszéd mérhető paramétereire. A kutatás alapjául szolgáló munka jelentős része az egészséges és beteg emberek beszédanyagának gyűjtése a klinikákon, kórházakban. Jelentős számban és jó minőségben rögzítettük a beszédpatológiás és egészséges beszélők beszédét, elkészítettük a beszédadatbázisokat és elérhetővé tettük más kutatók számára is. A véglegesített és anonimizált adatbázisok a következő url-en érhetők el: http://lsa.tmit.bme.hu/fundings/pathological_ai.html. Az összegyűjtött adatbázisok alapján két- és többosztályos osztályozási kísérleteket végeztünk a hangképzési rendellenességek, a depresszió és a Parkinson-kór kimutatására, szupport vektor gépek és mélytanulás felhasználásával. A három betegségtípus osztályozásán (egyenkénti felismerésén) kívül kidolgoztuk a betegségek súlyosságának automatikus értékelését is. Leraktuk az alapjait az automatikus diagnosztikai eljárások új csoportjának, a hangalapú diagnosztikának. Végül elkészült egy olyan demo alkalmazás, amely képes kiértékelni a beszélő beszédmintáját. Ez a rendszer jelenleg egy rövid rögzített szöveg alapján a fent említett három betegségtípus meglétét képes megbecsülni. A projektben dolgozó két kollégánk, Kiss Gábor és Tulics Miklós Gábriel sikeresen védte meg PhD értekezését a projekt két különböző résztémájában.
Results in English
During the project we examined the effect of changes in the vocal organs and the changes in certain neural processes controlling the motor function of voice production on the measurable parameters of the speech product. A significant part of the work was the collection of speech material from healthy and sick people at clinics and hospitals. We recorded the voices of pathological speech and healthy speakers in considerable numbers and quality, prepared the databases and made them available to researchers. The finalized and anonymized datasets are available at the following url: http://lsa.tmit.bme.hu/fundings/pathological_ai.html Based on the collected databases classification experiments were carried out to detect vocal disorders, depression and Parkinson’s disease using Support Vector Machines and deep learning. Also, automatic assessment of severity of the three types of illness were developed using different types of regression methods. We laid the foundations for a new group of automatic diagnostic procedures: voice-based diagnostics. A demo implementation was developed to evaluate a speaker’s voice sample, a prototype for assisting medical staff. This system is currently capable of estimating the probability of the three aforementioned types of voice disorders based on a short fixed text. Two of our colleagues working on the project, Gábor Kiss and Miklós Gábriel Tulics, successfully defended their PhD dissertations on two different sub-topics of the project.
Full text https://www.otka-palyazat.hu/download.php?type=zarobeszamolo&projektid=128568
Decision
Yes





 

List of publications

 
Miklós Gábriel Tulics, Klára Vicsi: The automatic assessment of the severity of dysphonia, INTERNATIONAL JOURNAL OF SPEECH TECHNOLOGY Vol.22. Issue 2 pp.341-350, 2019
Gábor Kiss, Dávid Sztahó, Klára Vicsi: Depression State Assessment: Application for detection of depression by speech, INTERSPEECH 2019: Show & Tell Contribution (September 15–19, 2019, Graz, Austria) pp. 966-967, 2019
Miklós Gábriel Tulics, Lívia Judit Lavati, Krisztina Mészáros, Klára Vicsi: Possibilities for the automatic classification of functional and organic dysphonia, SpeD 2019 ((10th Conference on Speech Technology and Human-Computer Dialogue, at Timișoara, Romania)), 2019
Dávid Sztahó, Gábor Kiss, Miklós Gábriel Tulics, Bálint Hajduska-Dér, Klára Vicsi: Automatic discrimination of several types of speech pathologies, SpeD 2019 (10th Conference on Speech Technology and Human-Computer Dialogue, at Timișoara, Romania), 2019
Dávid Sztahó, István Valálik, Klára Vicsi: Parkinson’s Disease Severity Estimation on Hungarian Speech Using Various Speech Tasks, SpeD 2019 (10th Conference on Speech Technology and Human-Computer Dialogue, at Timișoara, Romania), 2019
Miklós Gábriel Tulics, György Szaszák, Krisztina Mészáros, Klára Vicsi: Artificial Neural Network and SVM based Voice Disorder Classification, CogInfoCom 2019 (10th IEEE International Conference on Cognitive InfoCommunications, Naples, Italy) pp. 307-311, 2019
Dávid Sztahó, István Valálik: Speech Fluency Measurement of Patients with Parkinson’s Disease by Forward-Backward Divergence Segmentation, CogInfoCom 2019 (10th IEEE International Conference on Cognitive InfoCommunications, Naples, Italy) pp. 295-299, 2019
Daria Hemmerling, Dávid Sztahó: Parkinson's Disease Classification Based on Vowel Sound, MAVEBA 2019 (11th International Workshop Models and Analysis of Vocal Emissions for Biomedical Applications) /ELFOGADOTT/, 2019
Daria Hemmerling, Dávid Sztahó: Parkinson's Disease Classification Based on Vowel Sound, MAVEBA 2019 (11th International Workshop Models and Analysis of Vocal Emissions for Biomedical Applications) pp. 29-32, 2019
Dávid Sztahó, Anett Orosz, István Valálik: Articulation correctness measurement of Parkinson’s disease using low resource-intensitve segmentation methods, 11th IEEE International Conference on Cognitive Infocommunications (CogInfoCom 2020) pp. 121-124, 2020
Miklós Gábriel Tulics, György Szaszák, Krisztina Mészáros, Klára Vicsi: Using ASR Posterior Probability and Acoustic Features for Voice Disorder Classification, Proceedings of the 11th IEEE International Conference on Cognitive Infocommunications (CogInfoCom 2020) ID: 25, 2020
Jenei Attila Zoltán, Kiss Gábor: Depresszió detektálása korrelációs struktúrán alkalmazott konvolúciós hálók segítségével, XVI. Magyar Számítógépes Nyelvészeti Konferencia, Szeged, Hungary (SZTE Informatikai Intézet) 2020 pp. 59-71., 2020
Pašic Azra, Kiss Gábor, Sztahó, Dávid: A depresszió hang alapú felismerésének optimalizációja hangfelvétel hossz alapján, XVI. Magyar Számítógépes Nyelvészeti Konferencia ,Szeged, Hungary (SZTE Informatikai Intézet) (2020) pp. 83-92, 2020
Attila Zoltán Jenei, Gábor Kiss: Possibilities of Recognizing Depression with Convolutional Networks Applied in Correlation Structure, 43rd International Conference on Telecommunications and Signal Processing (TSP 2020) pp. 101-104., 2020
Gábor Kiss, Attila Zoltán Jenei: Investigation of the Accuracy of Depression Prediction Based on Speech Processing, 43rd International Conference on Telecommunications and Signal Processing (TSP 2020) pp. 129-132., 2020
Dávid Sztahó, Gábor Kiss, Miklós Gábriel Tulics: Deep Learning Solution for Pathological Voice Detection using LSTM-based Autoencoder Hybrid with Multi-Task Learning, BIOSIGNALS 2021, pp. 135-141, 2021
Attila Zoltán Jenei, Gábor Kiss: Severity Estimation of Depression Using Convolutional Neural Network, PERIODICA POLYTECHNICA-ELECTRICAL ENGINEERING AND COMPUTER SCIENCE 65(3) 227-234, 2021
Attila Zoltán Jenei, Gábor Kiss, Miklós Gábriel Tulics, Dávid Sztahó: Separation of Several Illnesses Using Correlation Structures with Convolutional Neural Networks, ACTA POLYTECHNICA HUNGARICA 18(7) 47-66, 2021
Gábor Kiss, Dávid Sztahó, Miklós Gábriel Tulics: Application for detecting depression, Parkinson’s disease and dysphonic speech, Interspeech 2021, Brno, Czech Republic, pp. 956-957, 2021
Péter Rozmán, Dávid Sztahó, Gábor Kiss, Attila Zoltán Jenei: Automatic recognition of depression and Parkinson’s disease by LSTM networks using sample chunking, CogInfoCom 2021 (online), 2021
Gábor Kiss, Miklós Gábriel Tulics, Attila Zoltán Jenei, Dávid Sztahó: Analysis of Cross Disorder Severity Prediction Problems Based on Speech Features, MAVEBA 2021 – elfogadott, megjelenés 2021. december, 2021
Tulics Miklós Gábriel: A diszfónia és automatikus felismerése, Markó Alexandra (szerk.): Tanulmányok a beszédtudomány alkalmazásainak köréből (ELTE Eötvös Kiadó) pp. 35-63., 2021
Kiss Gábor: A depresszió automatikus becslése a beszéd akusztikai-fonetikai jellemzői alapján, Markó Alexandra (szerk.): Tanulmányok a beszédtudomány alkalmazásainak köréből (ELTE Eötvös Kiadó) pp. 65-86., 2021
Péter Rozmán, Dávid Sztahó, Gábor Kiss, Attila Zoltán Jenei: Automatic recognition of depression and Parkinson’s disease by LSTM networks using sample chunking, Proceedings of COGINFOCOM 2021, pp. 163-166, 2021
Gábor Kiss, Miklós Gábriel Tulics, Attila Zoltán Jenei, Dávid Sztahó: Analysis of Cross Disorder Severity Prediction Problems Based on Speech Features, Proceedings of MAVEBA 2021, pp. 71-74, 2021
Bálint Hajduska-Dér, Gábor Kiss, Dávid Sztahó, Klára Vicsi, Lajos Simon: The applicability of the Beck Depression Inventory and Hamilton Depression Scale in the automatic recognition of depression based on speech signal processing, Frontiers in Psychiatry, p. 12 (doi:10.3389/fpsyt.2022.879896), 2022
Dávid Sztahó, Attila Zoltán Jenei, István Valálik, Klára Vicsi: The Effect of Speech Fragmentation and Audio Encodings on Automatic Parkinson’s Disease Recognition, J. Biomedical Science and Engineering 15(1) 6-25, 2022
Gábor Kiss: Investigation of speech-based language-independent possibilities of depression recognition, International Conference on Telecommunications and Signal Processing (TSP 2022) pp. 226-229, 2022
Attila Zoltán Jenei, Gábor Kiss, Dávid Sztahó: Detection of Speech Related Disorders by Pre-Trained Embedding Models Extracted Biomarkers, accepted paper (SPECOM 2022, Gurugram, India), 2022
Dávid Sztahó, Miklós Gábriel Tulics, Jinzi Qi, Hugo Van hamme, Klára Vicsi: Cross-lingual Detection of Dysphonic Speech for Dutch and Hungarian Datasets, Proceedings of BIOSIGNALS 2022, pp. 215-220, 2022





 

Events of the project

 
2021-03-05 15:45:42
Résztvevők változása
2019-04-25 15:38:08
Résztvevők változása




Back »