Ludzie od zawsze szukali wzorców, aby zrozumieć wszechświat i przewidzieć przyszłość. „Czerwone niebo wieczorem, żeglarza zbawienie. Czerwone niebo z rana, żeglarza przestroga” to powiedzenie używane do przewidywania pogody.
AI jest mistrzem w rozpoznawaniu wzorców i tworzeniu prognoz. Teraz naukowcy z Microsoftu pracują nad zastosowaniem „modeli bazowych” – dużych modeli, które wykorzystują najnowsze osiągnięcia AI – do różnych dyscyplin naukowych. Modele te są trenowane na szerokim zakresie danych i mogą wykonywać wiele zadań, w przeciwieństwie do bardziej wyspecjalizowanych modeli. Mają one potencjał, aby generować odpowiedzi w ułamku czasu potrzebnego tradycyjnie oraz pomagać w rozwiązywaniu bardziej złożonych problemów.
Niektóre z dziedzin naukowych, które mają największy potencjał do rozwoju dzięki AI, to nauka o materiałach, klimatologia oraz ochrona zdrowia i nauki o życiu. Eksperci twierdzą, że modele bazowe dostosowane do tych dziedzin przyspieszą proces odkryć naukowych, pozwalając na szybsze tworzenie praktycznych rozwiązań, takich jak leki, nowe materiały czy bardziej dokładne prognozy pogody, ale także lepsze zrozumienie atomów, ludzkiego ciała czy Ziemi. Obecnie wiele z tych modeli jest nadal w fazie rozwoju w Microsoft Research, ale pierwszy z nich, model pogodowy o nazwie Aurora, jest już dostępny.
„AI to narzędzie w waszym arsenale, które może was wspierać” – powiedziała Bonnie Kruft, partnerka i zastępczyni dyrektora w Microsoft Research, która nadzoruje ich laboratorium AI for Science. „Chodzi o to, że pracujemy nad modelami bardziej specyficznymi dla nauki, a nie dla języka. Widzimy niesamowitą możliwość wyjścia poza tradycyjne modele językowe na rzecz nowego paradygmatu, który wykorzystuje matematykę i symulacje molekularne do tworzenia jeszcze potężniejszych modeli do odkryć naukowych.”
Najnowsze postępy w AI, które umożliwiły ludziom planowanie przyjęć czy generowanie prezentacji graficznych za pomocą kilku prostych poleceń lub uzyskiwanie błyskawicznych streszczeń spotkań, były napędzane przez nową klasę modeli znanych jako duże modele językowe (LLM). Te modele bazowe są trenowane na ogromnych zbiorach tekstów do wykonywania różnorodnych zadań związanych z językiem. Teraz naukowcy z Microsoftu odkrywają, jak niektóre z tych samych architektur i podejść AI mogą przyczynić się do postępu w odkryciach naukowych.
„Duże modele językowe mają dwie niezwykłe cechy, które są bardzo użyteczne. Pierwsza to oczywiście to, że potrafią generować i rozumieć język ludzki, co zapewnia wspaniały interfejs człowiek-maszyna do bardzo zaawansowanych technologii. Ale druga cecha dużych modeli językowych – i to było dla wielu z nas dużym zaskoczeniem – to ich zdolność do działania jako efektywne silniki wnioskowania. I to oczywiście będzie bardzo użyteczne w odkryciach naukowych” – powiedział Chris Bishop, dyrektor Microsoft Research AI for Science, podczas wystąpienia na Microsoft Research Forum.
Na początku badacze AI sądzili, że bardzo specyficzne modele, wyszkolone do wykonywania wąskich zadań – jak te, które potrafią wygrać w szachy czy backgammona (ale nie w obu), albo te, które potrafią tłumaczyć języki lub transkrybować nagrania (ale nie obie rzeczy naraz) – będą przewyższać większe, uogólnione modele, takie jak LLM. Okazało się jednak, że jest inaczej – nie trzeba trenować osobnego modelu do odpowiadania na pytania o prawo, innego do fizyki, a jeszcze innego do Shakespeare’a, bo jeden duży, uogólniony model radził sobie lepiej we wszystkich tych dziedzinach. Teraz badacze badają możliwość, że modele bazowe mogą zrobić to samo dla nauki.
Tradycyjne kontra nowe podejście do odkryć naukowych
Tradycyjnie, odkrywanie naukowe polegało na tworzeniu hipotezy, testowaniu jej, wprowadzaniu zmian i powtarzaniu procesu, aż do znalezienia rozwiązania, lub zaczynaniu od nowa, eliminując to, co nie działa. Modele bazowe zmieniają ten proces, zamiast eliminować, one tworzą. Naukowcy mogą podać modelom bazowym parametry, na przykład jakie cechy chcą uzyskać, a modele mogą przewidzieć kombinacje molekuł, które mogłyby zadziałać. Zamiast szukać igły w stogu siana, modele sugerują, jak bezpośrednio tworzyć igły.
W niektórych przypadkach te modele bazowe są zaprojektowane tak, aby rozumiały język naturalny, co ułatwia naukowcom pisanie poleceń. Na przykład, aby znaleźć nowy materiał, naukowcy mogą określić, że chcą cząsteczkę, która jest stabilna (nie rozpadnie się), która nie jest magnetyczna, nie przewodzi elektryczności i nie jest rzadka ani droga.
LLM są trenowane na tekstach – słowach – ale modele bazowe, które opracowują naukowcy z Microsoftu, zostały w dużej mierze przeszkolone na językach nauki – nie tylko podręcznikach i artykułach naukowych, ale również na ogromnych ilościach danych generowanych podczas rozwiązywania równań z fizyki lub chemii.
Aurora, MatterGen, MatterSim – nowe modele AI
Model Aurora, który wynosi prognozowanie pogody i zanieczyszczeń na nowe poziomy, został przeszkolony na języku atmosfery Ziemi. MatterGen, który sugeruje nowe materiały, oraz MatterSim, który przewiduje, jak nowe materiały będą się zachowywać, zostały przeszkolone na języku molekuł. TamGen, opracowany we współpracy z Microsoft Research i Global Health Drug Discovery Institute (GHDDI), koncentruje się na innych molekułach – nowych lekach i inhibitorach białek do takich chorób jak gruźlica i COVID-19.
Każdy z tych modeli bazowych ma szerokie zastosowanie – modele materiałowe nie ograniczają się tylko do jednego rodzaju materiału, a model atmosferyczny nie tylko przewiduje deszcz, ale także inne zjawiska, takie jak zanieczyszczenie.
MatterGen to model AI opracowany przez Microsoft Research, który „może bezpośrednio generować materiały spełniające warunki projektowe,” powiedział Tian Xie, główny menedżer badań w Cambridge, UK. Naukowcy mogą nie tylko określić, jaki materiał chcą stworzyć, ale także sprecyzować jego właściwości mechaniczne, elektryczne, magnetyczne i inne.
Modele takie jak MatterGen są o trzy do pięciu rzędów wielkości bardziej efektywne w generowaniu materiałów niż tradycyjne metody.
MatterSim działa jako emulator, przewidując, jak cząsteczki nowego materiału będą się zachowywać. Dzięki symulacji MatterSim można wprowadzać iteracyjne zmiany, tak jak zmienia się zapytania w Microsoft Copilot, aż wyniki spełnią wymagania naukowców.
Aurora jest w stanie przetwarzać ogromne ilości danych i generować prognozy pogody w kilka sekund, a nie godzin, jak w przypadku tradycyjnych superkomputerów. Model ten łączy dane z modeli fizycznych z rzeczywistymi danymi z satelitów i stacji pogodowych, co pozwala na tworzenie bardziej precyzyjnych prognoz.
Ułatwienie dostępu do odkryć naukowych
Microsoft zamierza udostępnić wczesne wersje tych modeli, aby demokratyzować odkrycia naukowe i uzyskać opinie od społeczności, co pomoże kształtować przyszłe iteracje modeli. Modele bazowe AI mają potencjał, by zrewolucjonizować nie tylko odkrycia naukowe, ale i codzienne życie, przyspieszając postępy w takich dziedzinach jak medycyna i materiały, a także oferując głębsze zrozumienie skomplikowanych systemów, takich jak atomy, cząsteczki czy białka.