Umjetna inteligencija kreirala nešto što za što bi prirodnim putem trebalo 500 miliona godina. Ovako filmovi počinju


Smatra se da su se proteini prvi put pojavili na Zemlji prije otprilike 3,7 milijardi godina, a od tada ih je priroda skovala u molekule koje danas postoje. Ali što ako postoji način na koji bismo mogli umjetno oponašati taj proces – samo puno, puno brže?

To je upravo ono što grupa istraživača iz tvrtke EvolutionaryScale tvrdi da je učinila pomoću moći umjetne inteligencije (AI), generirajući kod za potpuno novi fluorescentni protein za početak.

Proteini se formiraju iz dugih nizova aminokiselina. Tehnički izraz za to je sekvenca, a razlike u navedenim sekvencama određuju konačnu strukturu i funkciju proteina.

Istraživači u svom radu pišu da se “[razvija] konsenzus da je u pozadini ovih sekvenci temeljni jezik biologije proteina koji se može razumjeti pomoću jezičnih modela.” Kad bi to bio slučaj, tada bi bilo moguće generirati sekvence za potpuno nove proteine, potencijalno divlje različite strukture i funkcije od onih koji već postoje.

Njihov pokušaj razumijevanja ovog jezika je ESM3, multimodalni generativni jezični model. Jednostavnije rečeno, to je vrsta generativne umjetne inteligencije – poput OpenAI-jevih raznih GPT-ova – ali umjesto da ga potakne da napiše vašu domaću zadaću kao kod ChatGPT-a, ovaj model izbacuje kod za protein, piše IFLS.

Uvježbano je na 771 milijardi jedinstvenih tokena – AI termin za jedinicu podataka – preuzetih iz baza podataka prirodnih sekvenci i struktura proteina, kao i nekih generiranih sintetičkih sekvenci. Ukupno su ti podaci sadržavali 3,15 milijardi proteinskih sekvenci, 236 miliona proteinskih struktura i 539 miliona proteina s funkcionalnim komentarima.

Sljedeći korak bio je vidjeti može li generirati potpuno novu sekvencu proteina. U ovom slučaju, tim je tražio od modela da generira nove fluorescentne proteine, potaknuvši ga nepotpunim receptom i zadatkom popunjavanja praznina.

I uspio je, generirajući sekvencu i strukturu za prethodno nepoznatu varijantu zelenog fluorescentnog proteina (GFP) – koji se često koristi u istraživanju stanica i molekularne biologije – nazvan esmGFP.

Prema EvolutionaryScaleu, ovaj novi protein “veliki je evolucijski odmak od prirodnih fluorescentnih proteina”, dijeleći samo 53 posto sličnosti u sekvenci u usporedbi s najbližim prirodno postojećim proteinom, eqFP578, pronađenim u anemoni s vrhom mjehurića. Istraživački tim u svom radu tvrdi da je ta divergencija “do stupnja ekvivalentna simulaciji preko 500 miliona godina evolucije.”

Međutim, nisu svi bili tako sigurni – profesorica mikrobne ekologije i evolucije na Sveučilištu u Bathu Tiffany Taylor, koja nije bila uključena u studiju, napisala je u Live Scienceu 2024. (kada je studija još bila preprint) da je “AI- inžinjering proteina potaknut je intrigantan, ali ne mogu se oteti osjećaju da bismo mogli biti pretjerano sigurni u pretpostavci da možemo nadmudriti zamršene procese koje milijunima godina prirodne selekcije.”

Ipak, kao što je rekao Taylor, to je zanimljiv koncept – ali za što bi tačno bio koristan? Web stranica EvolutionaryScale kaže da je njegov model “alat za znanstvenike da zamisle proteine ​​za hvatanje ugljika […] enzime koji razgrađuju plastiku [i] nove lijekove.”

Ipak, nema jamstva da će se to na kraju pretvoriti u stvarnost. Za sada, novootkriveni protein ostaje “generiran” samo u AI smislu.

Related Posts

1 of 337