sasava

Metaproteomik mikrob : daripada pemprosesan sampel, pengumpulan data kepada analisis data

Wu Enhui, Qiao Liang*

Jabatan Kimia, Universiti Fudan, Shanghai 200433, China

 

 

 

Mikroorganisma berkait rapat dengan penyakit dan kesihatan manusia. Bagaimana untuk memahami komposisi komuniti mikrob dan fungsinya adalah isu utama yang perlu dikaji segera. Dalam beberapa tahun kebelakangan ini, metaproteomik telah menjadi cara teknikal yang penting untuk mengkaji komposisi dan fungsi mikroorganisma. Walau bagaimanapun, disebabkan oleh kerumitan dan heterogeniti tinggi sampel komuniti mikrob, pemprosesan sampel, pemerolehan data spektrometri jisim dan analisis data telah menjadi tiga cabaran utama yang dihadapi oleh metaproteomik. Dalam analisis metaproteomik, selalunya perlu untuk mengoptimumkan prarawatan pelbagai jenis sampel dan menerima pakai skim pengasingan, pengayaan, pengekstrakan dan lisis mikrob yang berbeza. Sama seperti proteom spesies tunggal, mod pemerolehan data spektrometri jisim dalam metaproteomik termasuk mod pemerolehan bergantung data (DDA) dan mod pemerolehan bebas data (DIA). Mod pemerolehan data DIA boleh mengumpul sepenuhnya maklumat peptida sampel dan mempunyai potensi pembangunan yang besar. Walau bagaimanapun, disebabkan oleh kerumitan sampel metaproteom, analisis data DIAnya telah menjadi masalah utama yang menghalang liputan mendalam metaproteomik. Dari segi analisis data, langkah yang paling penting ialah pembinaan pangkalan data jujukan protein. Saiz dan kesempurnaan pangkalan data bukan sahaja memberi impak yang besar kepada bilangan pengenalan, tetapi juga mempengaruhi analisis pada peringkat spesies dan fungsian. Pada masa ini, piawaian emas untuk pembinaan pangkalan data metaproteome ialah pangkalan data jujukan protein berdasarkan metagenom. Pada masa yang sama, kaedah penapisan pangkalan data awam berdasarkan carian berulang juga telah terbukti mempunyai nilai praktikal yang kukuh. Dari perspektif strategi analisis data khusus, kaedah analisis data DIA yang berpusatkan peptida telah menduduki arus perdana mutlak. Dengan pembangunan pembelajaran mendalam dan kecerdasan buatan, ia akan sangat menggalakkan ketepatan, liputan dan kelajuan analisis analisis data makroproteomik. Dari segi analisis bioinformatik hiliran, satu siri alat anotasi telah dibangunkan dalam beberapa tahun kebelakangan ini, yang boleh melakukan anotasi spesies pada tahap protein, tahap peptida dan tahap gen untuk mendapatkan komposisi komuniti mikrob. Berbanding dengan kaedah omik lain, analisis fungsi komuniti mikrob adalah ciri unik makroproteomik. Makroproteomik telah menjadi bahagian penting dalam analisis multi-omik komuniti mikrob, dan masih mempunyai potensi pembangunan yang besar dari segi kedalaman liputan, kepekaan pengesanan dan kesempurnaan analisis data.

 

01Sampel prarawatan

Pada masa ini, teknologi metaproteomik telah digunakan secara meluas dalam penyelidikan mikrobiom manusia, tanah, makanan, lautan, enapcemar aktif dan bidang lain. Berbanding dengan analisis proteom spesies tunggal, prarawatan sampel metaproteom sampel kompleks menghadapi lebih banyak cabaran. Komposisi mikrob dalam sampel sebenar adalah kompleks, julat dinamik kelimpahan adalah besar, struktur dinding sel pelbagai jenis mikroorganisma sangat berbeza, dan sampel sering mengandungi sejumlah besar protein perumah dan kekotoran lain. Oleh itu, dalam analisis metaproteome, selalunya perlu untuk mengoptimumkan jenis sampel yang berbeza dan menggunakan skim pemisahan, pengayaan, pengekstrakan dan lisis mikrob yang berbeza.

Pengekstrakan metaproteom mikrob daripada sampel yang berbeza mempunyai persamaan tertentu serta beberapa perbezaan, tetapi pada masa ini terdapat kekurangan proses pra-pemprosesan bersatu untuk pelbagai jenis sampel metaproteom.

 

02Pemerolehan data spektrometri jisim

Dalam analisis proteom senapang patah, campuran peptida selepas prarawatan mula-mula diasingkan dalam lajur kromatografi, dan kemudian memasuki spektrometer jisim untuk pemerolehan data selepas pengionan. Sama seperti analisis proteom spesies tunggal, mod pemerolehan data spektrometri jisim dalam analisis makroproteom termasuk mod DDA dan mod DIA.

 

Dengan lelaran berterusan dan kemas kini instrumen spektrometri jisim, instrumen spektrometri jisim dengan kepekaan dan resolusi yang lebih tinggi digunakan pada metaproteom, dan kedalaman liputan analisis metaproteom juga terus dipertingkatkan. Untuk masa yang lama, satu siri instrumen spektrometri jisim resolusi tinggi yang diketuai oleh Orbitrap telah digunakan secara meluas dalam metaproteome.

 

Jadual 1 teks asal menunjukkan beberapa kajian perwakilan mengenai metaproteomik dari 2011 hingga sekarang dari segi jenis sampel, strategi analisis, instrumen spektrometri jisim, kaedah pemerolehan, perisian analisis dan bilangan pengenalan.

 

03Analisis data spektrometri jisim

3.1 Strategi analisis data DDA

3.1.1 Carian Pangkalan Data

3.1.2de novostrategi urutan

3.2 Strategi analisis data DIA

 

04Klasifikasi spesies dan anotasi berfungsi

Komposisi komuniti mikrob pada tahap taksonomi yang berbeza adalah salah satu bidang penyelidikan utama dalam penyelidikan mikrobiom. Dalam beberapa tahun kebelakangan ini, satu siri alat anotasi telah dibangunkan untuk menganotasi spesies pada tahap protein, tahap peptida, dan tahap gen untuk mendapatkan komposisi komuniti mikrob.

 

Intipati anotasi berfungsi adalah untuk membandingkan jujukan protein sasaran dengan pangkalan data jujukan protein berfungsi. Menggunakan pangkalan data fungsi gen seperti GO, COG, KEGG, eggNOG, dsb., analisis anotasi fungsi yang berbeza boleh dilakukan pada protein yang dikenal pasti oleh makroproteom. Alat anotasi termasuk Blast2GO, DAVID, KOBAS, dsb.

 

05Ringkasan dan Tinjauan

Mikroorganisma memainkan peranan penting dalam kesihatan dan penyakit manusia. Dalam beberapa tahun kebelakangan ini, metaproteomik telah menjadi cara teknikal yang penting untuk mengkaji fungsi komuniti mikrob. Proses analisis metaproteomik adalah serupa dengan proteomik spesies tunggal, tetapi disebabkan kerumitan objek penyelidikan metaproteomik, strategi penyelidikan khusus perlu diguna pakai dalam setiap langkah analisis, daripada prarawatan sampel, pemerolehan data kepada analisis data. Pada masa ini, terima kasih kepada penambahbaikan kaedah prarawatan, inovasi berterusan teknologi spektrometri jisim dan perkembangan pesat bioinformatik, metaproteomik telah mencapai kemajuan besar dalam kedalaman pengenalan dan skop aplikasi.

 

Dalam proses pra-rawatan sampel makroproteom, sifat sampel mesti dipertimbangkan terlebih dahulu. Cara mengasingkan mikroorganisma daripada sel dan protein persekitaran adalah salah satu cabaran utama yang dihadapi oleh makroproteom, dan keseimbangan antara kecekapan pengasingan dan kehilangan mikrob merupakan masalah yang perlu diselesaikan. Kedua, pengekstrakan protein mikroorganisma mesti mengambil kira perbezaan yang disebabkan oleh heterogeniti struktur bakteria yang berbeza. Sampel makroproteom dalam julat surih juga memerlukan kaedah pra-rawatan khusus.

 

Dari segi instrumen spektrometri jisim, instrumen spektrometri jisim arus perdana telah mengalami peralihan daripada spektrometer jisim berdasarkan penganalisis jisim Orbitrap seperti LTQ-Orbitrap dan Q Exactive kepada spektrometer jisim berdasarkan mobiliti ion yang digabungkan dengan penganalisis jisim masa penerbangan seperti timsTOF Pro . Siri instrumen timsTOF dengan maklumat dimensi mobiliti ion mempunyai ketepatan pengesanan yang tinggi, had pengesanan rendah dan kebolehulangan yang baik. Mereka secara beransur-ansur menjadi instrumen penting dalam pelbagai bidang penyelidikan yang memerlukan pengesanan spektrometri jisim, seperti proteom, metaproteom, dan metabolom bagi satu spesies. Perlu diingat bahawa untuk masa yang lama, julat dinamik instrumen spektrometri jisim telah mengehadkan kedalaman liputan protein penyelidikan metaproteome. Pada masa hadapan, instrumen spektrometri jisim dengan julat dinamik yang lebih besar boleh meningkatkan sensitiviti dan ketepatan pengenalan protein dalam metaproteom.

 

Untuk pemerolehan data spektrometri jisim, walaupun mod pemerolehan data DIA telah digunakan secara meluas dalam proteom satu spesies, kebanyakan analisis makroproteom semasa masih menggunakan mod pemerolehan data DDA. Mod pemerolehan data DIA boleh mendapatkan sepenuhnya maklumat ion serpihan sampel, dan berbanding dengan mod pemerolehan data DDA, ia berpotensi untuk mendapatkan maklumat peptida sampel makroproteom sepenuhnya. Walau bagaimanapun, disebabkan kerumitan data DIA yang tinggi, analisis data makroproteom DIA masih menghadapi kesukaran yang besar. Pembangunan kecerdasan buatan dan pembelajaran mendalam dijangka dapat meningkatkan ketepatan dan kesempurnaan analisis data DIA.

 

Dalam analisis data metaproteomik, salah satu langkah utama ialah pembinaan pangkalan data jujukan protein. Untuk bidang penyelidikan popular seperti flora usus, pangkalan data mikrob usus seperti IGC dan HMP boleh digunakan, dan keputusan pengenalpastian yang baik telah dicapai. Bagi kebanyakan analisis metaproteomik lain, strategi pembinaan pangkalan data yang paling berkesan adalah untuk mewujudkan pangkalan data jujukan protein khusus sampel berdasarkan data jujukan metagenomik. Untuk sampel komuniti mikrob dengan kerumitan tinggi dan julat dinamik yang besar, adalah perlu untuk meningkatkan kedalaman penjujukan untuk meningkatkan pengenalpastian spesies kelimpahan rendah, dengan itu meningkatkan liputan pangkalan data jujukan protein. Apabila data penjujukan kurang, kaedah carian berulang boleh digunakan untuk mengoptimumkan pangkalan data awam. Walau bagaimanapun, carian berulang mungkin menjejaskan kawalan kualiti FDR, jadi hasil carian perlu disemak dengan teliti. Di samping itu, kebolehgunaan model kawalan kualiti FDR tradisional dalam analisis metaproteomik masih patut diterokai. Dari segi strategi carian, strategi perpustakaan spektrum hibrid boleh meningkatkan kedalaman liputan metaproteomik DIA. Dalam beberapa tahun kebelakangan ini, perpustakaan spektrum yang diramalkan yang dihasilkan berdasarkan pembelajaran mendalam telah menunjukkan prestasi unggul dalam proteomik DIA. Walau bagaimanapun, pangkalan data metaproteom selalunya mengandungi berjuta-juta entri protein, yang menghasilkan skala besar perpustakaan spektrum yang diramalkan, menggunakan banyak sumber pengkomputeran dan menghasilkan ruang carian yang besar. Di samping itu, persamaan antara jujukan protein dalam metaproteom sangat berbeza, menjadikannya sukar untuk memastikan ketepatan model ramalan perpustakaan spektrum, jadi perpustakaan spektrum yang diramalkan tidak digunakan secara meluas dalam metaproteomik. Di samping itu, strategi anotasi inferens dan klasifikasi protein baharu perlu dibangunkan untuk digunakan pada analisis metaproteomik bagi protein yang serupa dengan jujukan.

 

Ringkasnya, sebagai teknologi penyelidikan mikrobiom yang sedang berkembang, teknologi metaproteomik telah mencapai hasil penyelidikan yang ketara dan juga mempunyai potensi pembangunan yang besar.


Masa siaran: 30 Ogos 2024