Dalam beberapa dekade terakhir, para peneliti telah bekerja keras untuk menyusun peta genom manusia, sebuah salinan lengkap dari instruksi genetik individu. Pada tahun 2000, para peneliti menyelesaikan draf pertama, tetapi masih membutuhkan komponen penting. Setelah menyelesaikan genom referensi pada tahun 2022, mereka masih memiliki jalan yang panjang. Genomika telah bekerja sama dengan Human Pangenome Research Consortium, kelompok yang terdiri dari 119 peneliti dari 60 institusi di seluruh dunia, untuk mengembangkan peta genom manusia yang lebih lengkap dan komprehensif.
Pangenome merupakan representasi perbaikan dari variasi genetik populasi manusia karena menggabungkan urutan referensi dari 47 genom yang berbeda. Para peneliti menggunakan teknologi deep learning dari Google dan kemajuan genomika sebelumnya untuk mengatasi kesulitan dalam menghasilkan urutan pangenome yang benar dan menerapkannya pada analisis genom dengan menggunakan teknik berbasis convolutional neural networks (CNNs) dan transformers.
Pemanfaatan pangenome ini memberikan manfaat dalam prosedur analisis downstream yang lebih baik. Sebuah manfaat besar dari referensi pangenome berbasis grafik adalah dapat mewakili polimorfik SVs secara akurat. Para peneliti membandingkan kegunaan referensi pangenome dengan genom referensi tipikal dengan memetakan data RNA sequencing (RNA-seq) simulasi ke kedua referensi, dan mendapatkan tingkat pemetaan palsu yang lebih rendah pada pipeline berbasis pangenome.
Namun, penggunaan grafik juga memperkenalkan berbagai masalah teknis. Diperlukan urutan referensi yang tepat dan penemuan teknik baru yang dapat menggunakan struktur data grafik. Namun, perkembangan yang menarik telah terjadi berkat aplikasi teknologi sekuensing modern, termasuk sekuensing konsensus dan pendekatan perakitan berfase.
Sub-topik 1: Penggunaan Transformer dalam Peningkatan Urutan Pan-Genome
Seiring dengan kemajuan teknologi sekuensing, kemajuan dalam informatika telah memungkinkan untuk teknik sekuensing yang lebih baik. Google menggunakan topologi transformer yang awalnya dikembangkan untuk menganalisis bahasa manusia untuk mempelajari urutan DNA, dan menciptakan DeepConsensus yang memberikan presisi yang dibutuhkan tanpa memerlukan decoder.
Dalam penelitian ini, para peneliti dapat mengembangkan assembler genom dengan akurasi tingkat dasar hingga 99,9997% dengan menggunakan DeepConsensus. Dalam penelitian ini, para peneliti juga berhasil menghasilkan kelompok pangenome baru yang menyediakan akses ke data genom manusia yang lebih akurat dan lengkap.
Sub-topik 2: Perkembangan Teknologi Sekuensing untuk Meningkatkan Referensi Pangenome
Selain penggunaan transformer, teknologi sekuensing yang lebih baik juga sangat diperlukan. Teknologi sekuensing berbasis pembacaan singkat yang dikembangkan pada tahun 2000-an hanya dapat membaca sebagian kecil dari genom manusia. Namun, teknologi sekuensing berbasis pembacaan panjang dapat membaca jutaan huruf DNA dan digunakan untuk membuat genom referensi berkualitas tinggi.
Teknologi sekuensing panjang juga memerlukan teknik informasi yang berbeda dari sekuensing singkat, dan beberapa organisasi telah memecahkan masalah tersebut dengan pengembangan algoritma baru.
Dalam kesimpulannya, pangenome reference adalah sebuah inovasi dalam representasi genom manusia yang lebih akurat dan lengkap. Meskipun penggunaan grafik memperkenalkan berbagai masalah teknis, pengembangan teknologi sekuensing dan informatika baru dapat membantu mengatasi masalah tersebut. Para peneliti di masa depan diharapkan dapat memanfaatkan referensi pangenome untuk melakukan penelitian dan praktek klinis yang lebih baik di masa depan.
Disarikan dari: Link