Sztuczna inteligencja coraz śmielej wkracza do astronomii. Jej użycie do badań przestrzeni pozaziemskiej może zrewolucjonizować nasze poznanie kosmosu. Także polskie ośrodki korzystają z analiz uczących się maszyn. Jest tylko jeden problem…
Astronomia z jednej strony była zawsze napędzana przez nowe technologie, a z drugiej – dawała powód do ich rozwoju. Kolejne generacje lunet i teleskopów umożliwiły dostrzeżenie księżyców Jowisza, ciał na rubieżach Układu Słonecznego, a wreszcie galaktyk na krańcach Wszechświata. Kolejnym krokiem było wykorzystanie klisz fotograficznych do utrwalenia wyników tych obserwacji. Pojawienie się matryc CCD (pierwszy raz użytych w latach 70. ub. w) spowodowało skokowy wzrost ilości danych w astronomii optycznej.
Tymczasem oprócz technologii, kluczowym elementem są właśnie dane. Kopernikowi udało się zmienić sposób patrzenia na Wszechświat dzięki temu, że swój model mógł odnieść do danych obserwacyjnych. Jego argumentacji nie sposób było odrzucić. Astronomia jest sztuką odniesienia modeli do danych i wyciągania wniosków.
Epokę masowej analizy danych w astronomii rozpoczęło stosowanie wszelkiego typu modeli statycznych, ograniczających ilość informacji, które musiałby przetworzyć człowiek. Jednak algorytmy tego typu nie mają swego rodzaju “intuicji” i są dość naiwne. Choć niewątpliwą zaletą jest możliwość ich stworzenia przy użyciu ograniczonych zasobów obliczeniowych, a takimi dysponowaliśmy w latach 80. i 90 zeszłego stulecia. Swego rodzaju “intuicję” w analizie danych przyniosła dopiero rewolucja związana z pojawieniem się sztucznej inteligencji (ang. Artificial Intelligence, AI).
Sam koncept sztucznej inteligencji nie jest nowy. Pierwsze algorytmy uczenia maszynowego powstały w latach 50. (Samuel, IBM – samouczący się program do gry w warcaby), równolegle z pierwszymi sieciami neuronowymi do obliczeń (Farley i Clark, MIT – 1954, Rosenblatt, Cornel – 1957). Natomiast wczesne badania utknęły w martwym punkcie około roku 1970, obecnie ten okres określa się jako AI winter. Dopiero w latach 80. znowu zaczęto wierzyć, że modele sztucznej inteligencji mogą stać się skuteczne. A boom na sztuczną inteligencję zaczął się po roku 2010.
AI poszuka „igły w stogu siana”
W astronomii pierwsze przymiarki do zastosowań sztucznej inteligencji pojawiły pod koniec lat 80. w Europejskim Obserwatorium Południowym. W branżowych artykułach przewidywano, że AI może znacząco pomóc w analizie danych astronomicznych. Mimo to, do 2005 roku tylko 21 naukowych artykułów recenzowanych odwoływało się do terminu machine learning w swoim streszczeniu. W latach 2013-2018 ich liczba wynosiła już ponad 600.
Obecnie w światowej astronomii AI jest stosowane w wielu kluczowych projektach. Niekiedy w formie dojrzałej, często nadal na etapie wdrażania. Należy podkreślić, że AI, w odróżnieniu od probabilistycznych metod Bayesowskich, może popełniać błędy. Często jest więc wykorzystywana jako pierwszy filtr danych, a następnie wyniki są przekazywane dalej do analizy przez dokładniejsze algorytmy.
Dziś trudno już znaleźć duży projekt astronomiczny, w którym AI nie byłoby wykorzystywane. Między innymi metody uczenia maszynowego służą wykrywaniu rozbłysków i usuwaniu artefaktów tła w obserwacjach optycznych (np. związanych z przelotem samolotu lub asteroidy podczas wykonywania zdjęcia). Ułatwiają rozpoznawanie i klasyfikację obserwowanych obiektów – od pozornie banalnego problemu odróżnienia gwiazd i odległych obiektów pozagalaktycznych, po bardziej wyrafinowane zastosowania do rekonstrukcji ich własności, poszukiwania rzadkich zjawisk i czy też wyszukiwania nieznanych dotąd klas źródeł, np. nieodkrytych wcześniej typów gwiazd. Efektownym przykładem może być dokonywany przez AI “pomiar” przesunięcia ku czerwieni, czyli rodzaju miary odległości, innych galaktyk czy kwazarów, czego nie jesteśmy w stanie dokonać bezpośrednio, nie mając danych spektroskopowych.
Jeden z największych planowanych obecnie teleskopów, który stanie w Vera Rubin Observatory w Chile, ma zbierać około 14 TB danych w ciągu jednej nocy. Szacuje się, że latach 2023-2035 zbierze on łącznie ponad 500 PB danych w ramach prowadzonego na nim projektu Legacy Survey of Space and Time (LSST), Co więcej, teleskop będzie obserwował niemal całe niebo południowe, powracając do tych samych miejsc co 3,5 nocy. Da to bezprecedensową możliwość niemal natychmiastowego wykrywania masy zjawisk przejściowych na niebie – od wybuchów supernowych, poprzez zderzenia gwiazd, po asteroidy i komety – ale pod jednym warunkiem. Te ogromne ilości danych będzie trzeba przesyłać i analizować na bieżąco. Dlatego choć program prowadzony jest przez konsorcjum amerykańskich uniwersytetów, zaangażowanych jest w niego kilkadziesiąt jednostek naukowych z całego świata, w tym z Polski (NCBJ, UW, UJ, UMK, CFT PAN, CAMK PAN). Analiza tak dużej ilości danych wymagać będzie bardzo dokładnych i bardzo szybkich algorytmów AI. Docelowa baza ta będzie pięć razy większa od bazy informacyjnej Facebooka z 2012 roku (120 PB). Jest to doskonały przykład astronomicznego przedsięwzięcia, które nie tylko korzysta z nowoczesnych technologii, ale stanowi dla niej wyzwanie i wymusza postęp.
Polskie projekty
Jednym z prekursorów zastosowania sztucznej inteligencji w eksploracji kosmosu w Polsce był zespół Pi of the Sky (UW, CFT PAN, NCBJ), który skupiał się na badaniu szybkozmiennych zjawisk astronomicznych, np. nowych. Pierwsze obserwacje wykonano w 2004 roku. System ten dowiódł swojej użyteczności w przypadku rozbłysku gamma GRB080319B, wykrywając poświatę optyczną w tym samym czasie. Co to oznacza? Promieniowanie gamma wytwarzane jest np. podczas wybuchów bomby atomowej, ale astronomowie obserwują dzięki niemu zjawiska poza nasza galaktyką. W przypadku tego konkretnego, wyjątkowo jasnego, rozbłysku można było zaobserwować zdarzenie, które miało miejsce we wczesnym Wszechświecie i lepiej poznać strukturę jednych z najbardziej energetycznych zjawisk występujących w kosmosie. Zaowocowało to publikacją w prestiżowym magazynie „Nature” wspólnie z naukowcami ze Swift i kilku innych zespołów. Projekt Pi of the Sky w pewnym sensie wyprzedzał swój czas. W latach jego realizacji (2004-2017) wykonał dużo ciekawych obserwacji i był drugim, po OGLE, całkowicie polskim projektem, który wykorzystywał analizę Big Data w polskiej astronomii.
Obecnie liczne ośrodki w Polsce stosują sztuczną inteligencję w badaniach kosmicznych. Obserwatorium Astronomiczne Uniwersytetu Warszawskiego (AO UW) wykorzystuje AI m.in. do analizy danych projektów OGLE i GAIA. Zespół z CAMK PAN jest zaangażowany w zastosowanie AI na potrzeby projektu LIGO oraz ewolucji gwiazdowych. W CFT PAN rozwijane są zastosowania AI do badań odległych galaktyk. W większości wypadków istniejące i zbierane właśnie dane stały się obszarem nowych zastosowań AI. W przypadku przyszłych, jeszcze większych projektów, będzie to już koniecznością.
Także w Narodowych Centrum Badań Jądrowych (NCBJ) od około 10 lat rozwija się grupa badawcza zajmująca się zastosowaniami AI w astrofizyce. Należy do niej m.in. autor tego artykułu. NCBJ nie tylko bierze udział w projektach wykorzystujących AI na potrzeby LIGO czy LSST. Inicjuje i współtworzy też własne projekty, często z zagranicznymi partnerami, takie jak poszukiwanie aktywnych jąder galaktyk prowadzone we współpracy z National Tsing Hua University w Hsinchu (Tajwan).
Szanse i trudności
Wbrew pozorom to nie szczupłe moce obliczeniowe są dziś największą przeszkodą w zastosowaniu sztucznej inteligencji do zadań naukowych. Skuteczne użycie AI na znaczącą skalę wymaga też dużych i wyspecjalizowanych grup badawczych. Tymczasem w Polsce problemem jest nadal mała liczba astronomów, którzy zajmują się AI. Najczęściej są to pojedyncze osoby na uniwersytetach lub w instytucjach naukowych, a nie całe grupy. Zespoły zajmujące się AI budują obecnie m.in. CAMK PAN i CFT PAN. Spore grono ekspertów, łączących AI z klasycznymi metodami badawczymi mamy także w Narodowym Centrum Badań Jądrowych.
Rozwijanie metod AI na potrzeby nauki wymaga połączenia bardzo dobrej wiedzy astronomicznej z głęboką wiedzą z zakresu informatyki. Tymczasem widoczną barierę stanowią… pensje w nauce i konstrukcja programów grantowych, która nie przewiduje wynagradzania specjalistów IT dołączających do zespołów astronomicznych po stawkach rynkowych, choćby zbliżonych do tych, jakie oferują firmy komercyjne. Rozwiązaniem stosowanym przez wiele grup jest szkolenie doktorantów w kierunku i technik IT i AI. To działanie z korzyścią dla doktorantów, ale odbywające się kosztem szybkości prowadzenia projektów. Jednak naukowcy, którzy nauczą się radzić sobie z danymi w peta-skali i algorytmami sztucznej inteligencji, łatwo znajdą pracę w sektorze przemysłowym.
Warto dodać, że zaangażowanie Polski w przemysł kosmiczny i przynależność do Europejskiej Agencji Kosmicznej (ESA) jest również – coraz bardziej wykorzystywaną – szansą rozwoju dla krajowych zastosowań AI w kosmosie, tak w przypadku nauki, jak i w biznesie. Jesteśmy ciągle na początku tej drogi. Z pewnością skuteczne zastosowanie sztucznej inteligencji w astronomii przyniesie wiele odkryć, trudnych bez niej do osiągnięcia.