Noile modele bazate pe inteligență artificială pot descoperi proteine necunoscute în mostre complexe, oferind perspective esențiale pentru cercetarea biologică și istorică.
După ce a revoluționat înțelegerea structurii proteice, inteligența artificială se impune acum în domeniul identificării proteinelor, procesul prin care sunt descoperite proteinele pe baza secvenței de aminoacizi care le compun, conform publicatiilor stiintifice.
Sistemele AI moderne, mai rapide și mai eficiente decât metodele clasice, permit detectarea proteinelor necunoscute, chiar și în mostre degradate din țesuturi infectate, medii acvatice sau situri arheologice.
O inovație recentă, descrisă într-un studiu publicat în Nature Machine Intelligence, provine de la o echipă europeană care a dezvoltat InstaNovo, un model AI capabil să identifice proteine patogene în răni și compuși proteici produși de microorganisme din medii marine.
InstaNovo este doar unul din numeroasele sisteme AI de acest tip apărute în ultimii patru ani.
„Este evidentă tendința domeniului în această direcție”, afirmă un cercetător în AI aplicată proteomicii la o universitate americană.
Folosirea acestor instrumente se extinde deja în biologia evoluționistă, unde sunt utilizate pentru analiza proteinelor antice care pot oferi indicii despre diferențele dintre Homo sapiens și strămoșii săi dispăruți.
Algoritmi inspirați de modele lingvistice
Spre deosebire de metodele tradiționale, care se bazează pe compararea fragmentelor de peptide cu baze de date existente, noile modele de inteligență artificială, inclusiv Casanovo și InstaNovo, reconstruiesc proteinele analizând toate combinațiile posibile de peptide, chiar și în absența unor corespondențe în baze de date.
Ele utilizează rețele neuronale similare celor care stau la baza modelelor lingvistice, pentru a „învăța” structura proteinelor, adică regulile prin care aminoacizii se combină.
InstaNovo introduce un mecanism inovator de „difuzie”, care introduce și elimină zgomot digital în datele de intrare pentru a rafinat rezultatul, o tehnică des întâlnită în generarea de imagini de către alte modele AI.
În teste de laborator, InstaNovo, precum și versiunea sa îmbunătățită, InstaNovo+, au identificat cu 42% mai multe peptide decât modelul precedent Casanovo.
Aplicat în practică, InstaNovo a detectat peste 1200 de peptide unice în proteina albumină din răni infectate, de zece ori mai multe decât metodele convenționale.
Dintre acestea, 254 erau complet necunoscute în bazele de date existente. Alte peptide au fost asociate cu 52 de proteine bacteriene, demonstrând capacitatea AI-ului de a analiza mostre biologice complexe.
Aplicații promițătoare în arheologie și mediu
Noile modele AI sunt deja aplicate și în cercetarea arheologică. Un specialist în paleoproteomică utilizează aceste modele pentru a analiza probe vechi de secole, în care proteinele sunt adesea degradate sau provin de la specii dispărute.
Modelele AI s-au dovedit eficiente în astfel de cazuri, identificând urme de proteine de la mamifere sau pești în situri arheologice și materiale antice.
„Aceste instrumente sunt extrem de utile, încât ne-am mutat întreaga cercetare pe această platformă”, afirmă specialistul. „Este o schimbare radicală în abordarea domeniului”, s-a precizat.
