• Osman Sait Akbaş

GENUS VERİ TABANI


Veri Tabanı Nedir?

Genus veri tabanına giriş yapmadan önce veri tabanının ne olduğundan bahsetmek ve kavramak gereklidir. Veri tabanları kısaca, internet ortamında herkesin erişiminde olan, birikimsel bilgi, kaynak ve verilerin depolanarak sunulduğu “dijital kütüphaneler” olarak tanımlanabilir. Günümüzde biyoenformatik alt bilim dalının bilgisayar teknolojilerinin gelişmesiyle sürekli katlanarak gelişen temel alanlarından birisidir. Veri tabanları günümüzde birçok alana ait verileri sunabilir. Bu alan bir bölgenin yıllara göre sıcaklık ortalamalarından tutun bir mobil uygulamanın kullanıcı bilgilerine dair de olabilir. Biyoloji ve moleküler biyoloji alanlarında kullanılan veri tabanları ise farklı organizmaların nükleik asit dizilerini içeren bir veri tabanı olabileceği gibi bu bilim alanlarında yapılmış deneylerin raporlarının depolandığı ve sunulduğu veri tabanları gibi çeşitli kapsamlarda ve içeriklerde de olabilir. Moleküler biyoloji çalışmalarında sıklıkla kullanılan veri tabanlarına PubMed, OMIM, GenBank, UniProt ve PDB örnek olarak verilebilir.

Genus Veri Tabanı Nedir?

Genus veri tabanı da sayılan veri tabanları gibi çoğunlukla moleküler biyoloji, genetik ve kimya alanlarında yapılan çalışmalarda kullanılan bir veri tabanıdır. Genus ver itabanı İngilizce dilindeki orijinal isminden anlaşılabileceği gibi (Genus for Biomolecules) temelde canlıların bileşenlerinden olan biyomoleküllerden RNA ve protein dizilerinin karmaşıklığına dair bilgiler sunan bir veri tabanıdır. Bu veri tabanında farklı canlılara ait farklı biyomoleküllerin (RNA için ribonükleik asit, proteinler içinse amino asit) dizileri başka bir veri tabanı olan PDB yani Protein Data Bank’ten alınır ve bu dizilere göre belirli bir algoritmayla o biyomoleküle ait Genus değeri hesaplanır. Her protein ve RNA dizisi bir Genus değerine sahiptir ve 5-10 gibi küçük bir değer olabileceği gibi 300 gibi yüksek değerlere de ulaşabilir. Moleküllere ait Genus değerinin büyüklüğü o molekülün ne kadar karmaşık olduğuna dair ipuçları sunar. Eğer bir molekül 200-300 gibi veya daha fazla bir Genus değerine sahip ise o molekülün, RNA veya protein, karmaşık bir yapısının olduğunu, uzun bir diziye sahip olduğunu gösterir. Eğer bir molekül daha küçük Genus değerlerine sahip ise o molekülün diğerlerine kıyasla daha basit yapıda olduğu ve daha kısa bir diziye sahip olduğu söylenebilir. Burada molekülün karmaşıklığından veya kompleks olmasından kasıt ise o molekülün sahip olduğu sekonder, tersiyer ve kuaterner yapılardır. Bilindiği üzere proteinler ve RNA molekülleri primer yani dizi sekanslarının yanında sekonder, tersiyer ve kuaterner yapılara da sahiptir. Yani Genus değeri büyük olan bir RNA ya da protein molekülü için uzun bir diziye sahip olmasının yanında bahsedilen sekonder, tersiyer ve kuaterner yapılarını da çokça içerdiği söylenebilir. Biraz da moleküller için hesaplanan ve Genus veri tabanın web sitesinde Genus Trace ve Genus Matrix gibi farklı şekillerde sunulan Genus değerinin nasıl hesaplandığından bahsedelim.

Genus Veri Tabanının Algoritması

Genus veri tabanı, biyomoleküller için Genus değerini b – n = 2 – 2g – r formülü ile hesaplar. Bu formülde molekül RNA ise ribonükleik asitler arasındaki, protein ise aminoasitler arasındaki bağlar ve bağ sayıları esas alınır. Formüldeki harflerin neyi temsil ettiğine gelecek olursak b “backbone” yani molekülün RNA ise fosfat-şeker omurga sayısı, protein ise aminoasit omurga sayısı olan, radikal grup dışında kalan karboksil ve amino grupları ve bunları bağlayan karbonu temsil eder. n harfi ise moleküldeki hidrojen bağı gibi bağların sayısını temsil eder. r harfi de o moleküle ait elde edilen ve 2 boyutlu bir gösterim olan “chord diagram” için bağlar arasındaki sınır sayısını belirtir. Sonuç olarak tüm değerler yerleştirildiğinde o molekül için spesifik olan ve karmaşıklık oranını veren “g” yani Genus değeri elde edilir. Genus değeri veri tabanında, Genus Trace ve Matrix gibi farklı 1 ve 2 boyutlu grafik gösterimlerle sunularak molekülün karmaşıklığının incelenmesinde kolaylıklar sağlar. Bu sayede farklı RNA ve proteinler kendi aralarında karşılaştırılabilir, diziler hakkında yorumlarda bulunulabilir ve bu bilgiler enzim ve protein mühendisliği gibi alanlarda protein dizaynlama için kullanılabilir.

Genus Veri Tabanının Diğer Özellikleri

Genus veri tabanında biyomoleküllerin Genus değerlerinin yanında o moleküle ait 3 boyutlu gösterimi, o protein veya RNA’nın sahip olduğu dizinin sekansı da incelenebilir. Ayrıca o molekül için oluşturulmuş linkte proteinler için sahip oldukları EC (Enzyme Comission) number yani o proteini temsilen enzim komisyonu numaralandırma sistemine göre belirlenen numaraya da ulaşılabilir ve bu sayede diğer veri tabanlarından protein için daha ileri düzeyde bilgiler elde edilebilir. Bunun dışında yapılan bir çalışmada eğer hangi protein veya RNA’ya ait olduğu bilinmeyen bir dizi elde edilmişse bu diziyi veri tabanına dizinin sekansını csv veya CHIMERA dosya formatlarında yükleyerek o molekül için Genus değerini ve Genus Trace grafik gösterimine de ulaşabilirsiniz. Genus veri tabanı özet olarak RNA ve protein biyomolekülleri için bir Genus değeri hesap eden ve bu değeri farklı şekillerde sunarak o molekül hakkında bilgi edinmemize yarayan bir veri tabanıdır. Bu veri tabanı, enzim ve protein çalışmalarında kullanılabilecek bilgiler sunar ve yeni bir veri tabanı olup gün geçtikçe içerisindeki dizi miktarını da arttırmaktadır. Genus veri tabanına ulaşmak, RNA ve proteinlerin Genus değerlerini incelemek ve veri tabanının diğer özellikleri hakkında daha fazla bilgi edinebilmek için veri tabanının web adresi olan https://genus.fuw.edu.pl/ linkine tıklayabilirsiniz.