sasava

Mikrobna metaproteomika: od obrade uzoraka, prikupljanja podataka do analize podataka

Wu Enhui, Qiao Liang*

Odsjek za hemiju, Univerzitet Fudan, Šangaj 200433, Kina

 

 

 

Mikroorganizmi su usko povezani sa ljudskim bolestima i zdravljem. Kako razumjeti sastav mikrobnih zajednica i njihove funkcije je glavno pitanje koje treba hitno proučiti. Posljednjih godina metaproteomika je postala važno tehničko sredstvo za proučavanje sastava i funkcije mikroorganizama. Međutim, zbog složenosti i visoke heterogenosti uzoraka mikrobne zajednice, obrada uzoraka, prikupljanje podataka masenom spektrometrijom i analiza podataka postali su tri glavna izazova s ​​kojima se trenutno suočava metaproteomika. U metaproteomičkoj analizi, često je potrebno optimizirati prethodnu obradu različitih tipova uzoraka i usvojiti različite šeme mikrobnog odvajanja, obogaćivanja, ekstrakcije i lize. Slično kao kod proteoma jedne vrste, načini prikupljanja podataka masene spektrometrije u metaproteomici uključuju način prikupljanja podataka ovisnog o podacima (DDA) i način prikupljanja podataka neovisnog o podacima (DIA). DIA način prikupljanja podataka može u potpunosti prikupiti informacije o peptidima uzorka i ima veliki razvojni potencijal. Međutim, zbog složenosti metaproteomskih uzoraka, njegova DIA analiza podataka postala je veliki problem koji ometa duboku pokrivenost metaproteomike. U smislu analize podataka, najvažniji korak je izgradnja baze podataka sekvenci proteina. Veličina i kompletnost baze podataka ne samo da imaju veliki uticaj na broj identifikacija, već utiču i na analizu na nivou vrste i na funkcionalnom nivou. Trenutno, zlatni standard za izgradnju metaproteomske baze podataka je baza podataka sekvenci proteina zasnovana na metagenomu. U isto vrijeme, metoda filtriranja javnih baza podataka zasnovana na iterativnom pretraživanju također se pokazala kao jaka praktična vrijednost. Iz perspektive specifičnih strategija analize podataka, metode analize podataka DIA usmjerene na peptide su zauzele apsolutni mainstream. Uz razvoj dubokog učenja i umjetne inteligencije, uvelike će promovirati tačnost, pokrivenost i brzinu analize makroproteomskih podataka. U smislu nizvodne bioinformatičke analize, posljednjih godina razvijen je niz alata za označavanje, koji mogu izvršiti označavanje vrsta na nivou proteina, peptida i gena kako bi se dobio sastav mikrobnih zajednica. U poređenju sa drugim metodama omike, funkcionalna analiza mikrobnih zajednica je jedinstvena karakteristika makroproteomike. Makroproteomika je postala važan dio multi-omičke analize mikrobnih zajednica, i još uvijek ima veliki razvojni potencijal u smislu dubine pokrivenosti, osjetljivosti detekcije i potpunosti analize podataka.

 

01 Predtretman uzorka

Trenutno se tehnologija metaproteomike široko koristi u istraživanju ljudskog mikrobioma, tla, hrane, okeana, aktivnog mulja i drugim poljima. U poređenju sa proteomskom analizom jedne vrste, predtretman metaproteoma složenih uzoraka se suočava sa više izazova. Mikrobni sastav u stvarnim uzorcima je složen, dinamički raspon obilja je velik, struktura stanične stijenke različitih vrsta mikroorganizama je vrlo različita, a uzorci često sadrže veliku količinu proteina domaćina i drugih nečistoća. Stoga je u analizi metaproteoma često potrebno optimizirati različite tipove uzoraka i usvojiti različite šeme mikrobnog odvajanja, obogaćivanja, ekstrakcije i lize.

Ekstrakcija mikrobnih metaproteoma iz različitih uzoraka ima određene sličnosti kao i neke razlike, ali trenutno postoji nedostatak jedinstvenog procesa prethodne obrade za različite tipove metaproteomskih uzoraka.

 

02Prikupljanje podataka masenom spektrometrijom

U analizi proteoma sačmom, mješavina peptida nakon prethodnog tretmana se prvo odvaja u hromatografskoj koloni, a zatim ulazi u maseni spektrometar za prikupljanje podataka nakon jonizacije. Slično analizi proteoma pojedinačnih vrsta, načini prikupljanja podataka masene spektrometrije u analizi makroproteoma uključuju DDA mod i DIA mod.

 

Uz kontinuiranu iteraciju i ažuriranje instrumenata masene spektrometrije, instrumenti masene spektrometrije sa većom osjetljivošću i rezolucijom se primjenjuju na metaproteom, a dubina pokrivenosti metaproteomske analize se također kontinuirano poboljšava. Dugo vremena, serija instrumenata masene spektrometrije visoke rezolucije na čelu sa Orbitrapom se široko koristi u metaproteomu.

 

Tabela 1 originalnog teksta prikazuje neke reprezentativne studije o metaproteomici od 2011. do danas u smislu tipa uzorka, strategije analize, instrumenta masene spektrometrije, metode akvizicije, softvera za analizu i broja identifikacija.

 

03 Analiza podataka masene spektrometrije

3.1 Strategija analize podataka DDA

3.1.1 Pretraga baze podataka

3.1.2de novostrategija sekvenciranja

3.2 Strategija analize podataka DIA

 

04Klasifikacija vrsta i funkcionalna napomena

Sastav mikrobnih zajednica na različitim taksonomskim nivoima jedno je od ključnih istraživačkih područja u istraživanju mikrobioma. Poslednjih godina razvijen je niz alata za označavanje vrsta na nivou proteina, peptida i gena kako bi se dobio sastav mikrobnih zajednica.

 

Suština funkcionalne anotacije je da se uporedi sekvenca ciljnog proteina sa bazom podataka sekvenci funkcionalnih proteina. Koristeći baze podataka o funkcijama gena kao što su GO, COG, KEGG, eggNOG, itd., različite analize funkcionalnih anotacija mogu se izvršiti na proteinima identificiranim makroproteomima. Alati za napomene uključuju Blast2GO, DAVID, KOBAS, itd.

 

05 Sažetak i Outlook

Mikroorganizmi igraju važnu ulogu u ljudskom zdravlju i bolestima. Posljednjih godina, metaproteomika je postala važno tehničko sredstvo za proučavanje funkcije mikrobnih zajednica. Analitički proces metaproteomike sličan je onom kod proteomike jedne vrste, ali zbog složenosti istraživačkog objekta metaproteomike, u svakom koraku analize potrebno je usvojiti specifične strategije istraživanja, od prethodnog tretmana uzorka, prikupljanja podataka do analize podataka. Trenutno, zahvaljujući poboljšanju metoda predtretmana, kontinuiranoj inovaciji tehnologije masene spektrometrije i brzom razvoju bioinformatike, metaproteomika je postigla veliki napredak u dubini identifikacije i opsegu primjene.

 

U procesu prethodnog tretmana uzoraka makroproteoma, prvo se mora uzeti u obzir priroda uzorka. Kako odvojiti mikroorganizme od ćelija i proteina životne sredine jedan je od ključnih izazova sa kojima se suočavaju makroproteomi, a ravnoteža između efikasnosti razdvajanja i gubitka mikroba je hitan problem koji treba rešiti. Drugo, ekstrakcija proteina mikroorganizama mora uzeti u obzir razlike uzrokovane strukturnom heterogenošću različitih bakterija. Uzorci makroproteoma u rasponu tragova također zahtijevaju posebne metode prethodnog tretmana.

 

Što se tiče instrumenata masene spektrometrije, glavni instrumenti masene spektrometrije prošli su tranziciju sa masenih spektrometara zasnovanih na analizatorima mase Orbitrap kao što su LTQ-Orbitrap i Q Exactive na masene spektrometre bazirane na mobilnošću jona spregnute masene analizatore vremena leta kao što je timsTOF Pro . TimsTOF serija instrumenata sa informacijama o dimenzijama pokretljivosti jona ima visoku tačnost detekcije, nisku granicu detekcije i dobru ponovljivost. Oni su postepeno postali važni instrumenti u različitim istraživačkim poljima koja zahtijevaju detekciju masenom spektrometrijom, kao što su proteom, metaproteom i metabolom jedne vrste. Vrijedi napomenuti da je dugo vremena dinamički raspon instrumenata masene spektrometrije ograničavao dubinu pokrivenosti proteinima istraživanja metaproteoma. U budućnosti, instrumenti masene spektrometrije sa većim dinamičkim rasponom mogu poboljšati osjetljivost i tačnost identifikacije proteina u metaproteomima.

 

Za prikupljanje podataka masenom spektrometrijom, iako je način prikupljanja podataka DIA široko prihvaćen u proteomu jedne vrste, većina najnovijih analiza makroproteoma još uvijek koristi DDA način prikupljanja podataka. Način prikupljanja podataka DIA može u potpunosti dobiti informacije o fragmentima jona uzorka, a u poređenju sa načinom prikupljanja podataka DDA, ima potencijal da u potpunosti dobije informacije o peptidima uzorka makroproteoma. Međutim, zbog velike složenosti DIA podataka, analiza DIA makroproteomskih podataka i dalje se suočava sa velikim poteškoćama. Očekuje se da će razvoj veštačke inteligencije i dubokog učenja poboljšati tačnost i potpunost analize podataka DIA.

 

U analizi podataka metaproteomike, jedan od ključnih koraka je izgradnja baze podataka sekvenci proteina. Za popularna područja istraživanja kao što je crijevna flora, mogu se koristiti crijevne mikrobne baze podataka kao što su IGC i HMP i postignuti su dobri rezultati identifikacije. Za većinu drugih metaproteomskih analiza, najefikasnija strategija izgradnje baze podataka je i dalje uspostavljanje baze podataka o sekvenci proteina specifične za uzorak baziranu na podacima o metagenomskom sekvenciranju. Za uzorke mikrobne zajednice sa visokom složenošću i velikim dinamičkim rasponom, potrebno je povećati dubinu sekvenciranja kako bi se povećala identifikacija vrsta sa niskim obiljem, čime se poboljšava pokrivenost baze podataka sekvenci proteina. Kada nedostaju podaci o sekvenciranju, može se koristiti iterativni metod pretraživanja za optimizaciju javne baze podataka. Međutim, iterativno pretraživanje može utjecati na kontrolu kvalitete FDR-a, tako da rezultate pretraživanja treba pažljivo provjeriti. Osim toga, još uvijek vrijedi istražiti primjenjivost tradicionalnih FDR modela kontrole kvaliteta u analizi metaproteomike. U smislu strategije pretraživanja, strategija hibridne spektralne biblioteke može poboljšati dubinu pokrivenosti DIA metaproteomike. Poslednjih godina, predviđena spektralna biblioteka generisana na osnovu dubokog učenja pokazala je superiorne performanse u DIA proteomici. Međutim, metaproteomske baze podataka često sadrže milione unosa proteina, što rezultira velikom skalom predviđenih spektralnih biblioteka, troši mnogo računarskih resursa i rezultira velikim prostorom za pretragu. Osim toga, sličnost između proteinskih sekvenci u metaproteomima uvelike varira, što otežava osiguravanje tačnosti modela predviđanja spektralne biblioteke, tako da se predviđene spektralne biblioteke nisu široko koristile u metaproteomici. Pored toga, potrebno je razviti nove strategije zaključivanja proteina i klasifikacije anotacija koje bi se primjenjivale na metaproteomičku analizu proteina koji su vrlo slični sekvenci.

 

Ukratko, kao nova tehnologija istraživanja mikrobioma, tehnologija metaproteomike je postigla značajne istraživačke rezultate i također ima ogroman razvojni potencijal.


Vrijeme objave: 30.08.2024