Uczenie maszynowe pozwoli analizować DNA nawet 30 razy szybciej. Możliwe będzie badanie rzadkich komórek, np. rakowych, dotychczas niemożliwych do przebadania. Naukowcy z Nvidii oraz Wydziału Komórek Macierzystych i Biologii Regeneracyjnej Uniwersytetu Harvarda opracowali AtacWorks, narzędzie służące do odszumiania danych uzyskanych z sekwencjonowania DNA. Opiera się ono na współdziałaniu uczenia maszynowego i pracy procesorów graficznych GPU. Dzięki niemu analiza próbek może się odbywać nawet trzydziestokrotnie szybciej niż z użyciem tradycyjnych metod. Odkrycie może oznaczać przełom we wczesnym wykrywaniu raka i chorób genetycznych. – Za pomocą AtacWorks jesteśmy w stanie przeprowadzić na pojedynczych komórkach eksperymenty, które zazwyczaj wymagałyby 10 razy większej liczby komórek – wskazuje Jason Buenrostro, adiunkt na Uniwersytecie Harvarda, twórca metody ATAC-seq i współautor artykułu w prestiżowym piśmie „Nature”. Rozwiązanie opisane przez inżynierów Nvidii i naukowców Uniwersytetu Harvarda w „Nature” opiera się na technice ATAC-seq, służącej analizie DNA opartej na badaniu chromatyny w pojedynczych komórkach. Dzięki niej możliwe jest znajdowanie otwartych obszarów w genomie zdrowych i chorych komórek, co może stanowić punkt wyjścia np. w opracowywaniu nowych leków. Standardowo zastosowanie procedury ATAC-seq wymaga dostarczenia dziesiątek tysięcy komórek do przygotowania preparatu, z którego można wyizolować niezaszumiony sygnał. Jest to kłopotliwe w momencie, gdy badaniu trzeba poddać komórki rzadkie, takie jak komórki macierzyste. Narzędzie AtacWorks pozwala na wykorzystanie w takim samym badaniu zaledwie kilkudziesięciu komórek. – Odszumienie niskiej jakości danych z sekwencjonowania za pomocą głębokiego uczenia maszynowego wspieranego przez procesory graficzne GPU może mieć ogromny wpływ na naszą zdolność do badania zmian epigenetycznych związanych z rozwojem i chorobami komórek rzadkich – wskazuje Jason Buenrostro.
AtacWorks jest konwolucyjną siecią neuronową przeszkoloną na parach zestawów danych Atac-seq, z których jedne były dobrej jakości, a drugie zaszumione. Wykorzystanie do jej pracy procesorów graficznych NVIDIA Tensor Core umożliwiło przeprowadzenie w zaledwie pół godziny analizy, która normalnie zajęłaby 15 godzin. Co więcej, dostarczone do analizy dane zawierały pięćdziesięciokrotnie mniej odczytów. – W przypadku bardzo rzadkich typów komórek nie jest możliwe badanie różnic w ich DNA przy użyciu istniejących metod – podkreśla Avantika Lal, badaczka z firmy NVIDIA, główna autorka artykułu w „Nature”. – AtacWorks może nie tylko pomóc obniżyć koszty gromadzenia danych o dostępności chromatyny, lecz także otworzyć nowe możliwości w odkrywaniu nowych leków i diagnostyce. Dzięki temu rozwiązaniu będzie można identyfikować określone mutacje lub biomarkery, które zwiększają podatność ludzi na choroby, takie jak m.in. choroba Alzheimera, choroby serca czy nowotwory. Może też znacznie ułatwić opracowywanie nowych leków. Naukowcy zastosowali AtacWorks do analizy komórek macierzystych, wytwarzając rzadkie podtypy czerwonych i białych krwinek. Przy tradycyjnych metodach badań ich analiza byłaby niemożliwa. Z raportu InsightAce Analytic wynika, że światowy rynek sztucznej inteligencji w genomice był w 2019 roku wyceniany na 142,5 mln dol. Do 2028 roku tempo wzrostu utrzyma się na średniorocznym poziomie równym 39 proc. aż do osiągnięcia wyceny na poziomie 2,76 mld dol.
źródło: @newseria / Nvidia / Uniwersytet Harvarda