Neurorecognition visualization in multitask end-to-end speech
Fragment książki (Rozdział monografii pokonferencyjnej)
MNiSW
20
Poziom I
| Status: | |
| Autorzy: | Mamyrbayev Orken, Pavlov Sergii V., Bekarystankyzy Akbayan, Oralbekova Dina, Zhumazhanov Bagashar, Azarova Larysa E., Mussayeva Dinara, Koval Tetiana, Gromaszek Konrad, Issimov Nurdaulet, Shiyapov Kadrzhan |
| Dyscypliny: | |
| Aby zobaczyć szczegóły należy się zalogować. | |
| Wersja dokumentu: | Drukowana | Elektroniczna |
| Język: | angielski |
| Strony: | 1 - 8 |
| Web of Science® Times Cited: | 0 |
| Scopus® Cytowania: | 0 |
| Bazy: | Web of Science | Scopus |
| Efekt badań statutowych | NIE |
| Materiał konferencyjny: | TAK |
| Nazwa konferencji: | 20th meeting in the series of National Symposia "Fiber Optics and their Applications" |
| Skrócona nazwa konferencji: | 20th OFTA 2023 |
| URL serii konferencji: | LINK |
| Termin konferencji: | 11 września 2023 do 14 września 2023 |
| Miasto konferencji: | Lublin |
| Państwo konferencji: | POLSKA |
| Publikacja OA: | NIE |
| Abstrakty: | angielski |
| Nowadays, speech-processing technologies with different language systems are successfully used in mobile and stationary devices. Kazakh is considered a low-resource language, which poses various challenges for conventional speech recognition methods. This paper presents a proposed model capable of multitasking and handling concurrent speech recognition, dialect identification, and speaker identification, all in an end-to-end framework. The developed multitask model enables training three different tasks within a single model. A multitask recognition system is created based on the WaveNet-CTC model. Experiments show that for the concrete task end-to-end multitask model has better performance than other models. |