پیشگویی کلاسهای ساختاری پروتئینها در دو وضعیت با استفاده از مدل ترکیبی عصبی-لوجستیک

نویسندگان

چکیده

هدف مطالعه پیشنهادی پیشگویی کلاسهای ساختاری پروتئین ها در دو وضعیت (تمام آلفا و تمام بتا) با استفاده از روش مدل سازی ترکیبی دو مرحله‌ای با شبکه عصبی مصنوعی (ANN) و مدل لوجستیک رگرسیون (LRM) است. ساختار شبکه و فرایند آموزش طولانی، کاربرد آن را در تمام زمینه‌ها محدود کرده است. پیشگویی کلاسهای ساختاری پروتئین‌ها روی یک سری داده (104n=) از پروتئین‌های غیر همولوگ تک‌دومین کروی اجرا شد. پارامترهای معنا‌دار آماری در مدل لوجستیک رگرسیون فراوانی تکی اسید‌آمینه‌های والین و گلیسین همچنین فراوانی ترکیبات دوتایی لیزین-پرولین، ایزولوسین-سرین، گلوتامین- سرین و گلوتامین- پرولین بودند. در بین ترکیبات سه تایی نیز تنها فراوانی ترکیب آسپاراژین- لوسین- آسپارتیک اسید معنادار بود. پیشگویی کلاسهای ساختاری در دو وضعیت (تمام آلفا و تمام بتا) تنها بر اساس هفت شاخص ساختاری معنی‌دار به عنوان متغیر‌های ورودی از بین 642 متغیر ساختاری 88% کارایی نشان داد. در این مطالعه، هر دو شاخص وابسته به آستانه و غیر وابسته (ROC) برای ارزیابی مدل استفاده شده است.

کلیدواژه‌ها