Computer-supported process of proteomic data profiling
Artykuł w czasopiśmie
MNiSW
10
Lista B
Status: | |
Warianty tytułu: |
Wspomagany komputerowo proces profilowania danych proteomicznych
|
Autorzy: | Plechawska-Wójcik Małgorzata |
Rok wydania: | 2014 |
Wersja dokumentu: | Elektroniczna |
Język: | angielski |
Numer czasopisma: | 6 |
Strony: | 8730 - 8739 |
Efekt badań statutowych | NIE |
Materiał konferencyjny: | NIE |
Publikacja OA: | TAK |
Licencja: | |
Sposób udostępnienia: | Witryna wydawcy |
Wersja tekstu: | Ostateczna wersja opublikowana |
Czas opublikowania: | W momencie opublikowania |
Abstrakty: | polski | angielski |
Artykuł przedstawia kompletny, złożony proces profilowania danych proteomicznych uzyskanych w badaniach spektrometrycznych. Podstawowa opisana procedura analizy jest oparta o analizę modelu reprezentującego dane mieszanin gaussowskich. Jednak proces analizy danych spektrometrycznych jest bardziej złożony i składa się z wielu procedur, takich jak przygotowanie danych, wstępne przetwarzanie danych, detekcji danych odstających oraz usuwania szumu. Widmo średnie obliczone na podstawie otrzymanych danych jest modelowane w oparciu o model mieszanin gaussowskich dekomponowany za pomocą algorytmu maksymalizacji oczekiwanej wartości. W tym procesie wyszukiwane są pozycje pików z widma średniego. Otrzymane wyniki są nakładane na każde pojedyncze widmo w postaci maski gaussowskiej. Rezultatem jest zestaw danych gotowych do dalszej analizy statystycznej. Procedura ta pozwala wykonać profilowanie danych proteomicznych przy użyciu określonych metod statystycznych. | |
The paper presents the complete and complex process of proteomic data profiling obtained in the process of mass spectrometry. The main described procedure is based on analyzing Gaussian Mixture Model representation of the data. However, the process of mass spectrometry data analysis is more complex and consists of a number of procedures, like data preparation, data pre-processing including baseline correction, detection of outliers and noise removal. The mean spectrum calculated based on received data is modeled with GMM and decomposed using the Expectation-Maximization algorithm. In this process localization of the mean spectrum peaks is found. Those results are applied into each single spectrum in the dataset in the form of Gaussian mask. The result in a set of data ready for further statistical analysis. This procedure enable to perform proteomic data profiling using specific statistical methods. |