بازگشت به بانک اطلاعات پایان نامه ها

شماره دانشجویی : 920096040
نویسنده : سیده سحر تیموری سندسی
عنوان پایان نامه : ارزیابی کارایی ضرب برداری ماتریس های پراکنده بر روی پردازنده گرافیکی
دانشكده : دانشکده تحصیلات تکمیلی و مجتمع فنی
گروه تحصيلي : کامپیوتر
رشته/گرایش تحصيلي : مهندسي كامپيوتر- نرم افزار
مقطع تحصيلي : کارشناسی ارشد
استاد راهنما (استاد مدعو) : , دکتر شاه بهرامی,
استاد مشاور (استاد مشاور مدعو) : , اکباتانی فرد,
چكيده : ضرب برداری ماتریس های پراکنده یکی از الگوریتم های مهم و پرکاربرد در حل بسیاری از مسائل علمی و پروژ های مهندسی به شمار می رود. بنابراین کارایی بسیاری از محاسبات وابسته به کارایی الگوریتم ضرب برداری ماتریس پراکنده است. به دلیل اهمیت این مسائل، تاکنون تلاش های بسیاری جهت بهبود کارایی الگوریتم ضرب برداری ماتریس پراکنده بر روی معماری های گوناگون با معرفی فرمت های جدید برای ذخیره ماتریس پراکنده و بهینه سازی متدهای پردازش بر روی این فرمت ها صورت گرفته است. استفاده از پردازش موازی برای محاسبه الگوریتم ضرب برداری ماتریس های پراکنده به دلیل قابلیت موازی سازی بالای الگوریتم های پیاده سازی آن، کارایی را به شدت افزایش می دهد. همچنین الگوریتم ضرب برداری ماتریس های پراکنده از الگوریتم هایی است که تراکنش آن با حافظه بسیار زیاد است. بنابراین استفاده از پردازنده گرافیکی به علت توان بالای آن در اجرای موازی برنامه ها و دارا بودن پهنای باند بالا، در بهبود کارایی این الگوریتم بسیار مؤثر است. بعد از معرفی ساختار CUDA توسط شرکت Nvidia، پردازنده های گرافیکی به یک انتخاب مناسب محاسبه موازی برنامه های همه منظوره برای حل مسائل عددی پیچیده تبدیل شدند. هدف این پایان نامه، پیاده سازی فرمت های ذخیره سازی ماتریس های پراکنده مانند ELLR-T، RgCSR، ELL، scalar CSR،CSR vector بر روی پردازنده گرافیکی و ارزیابی کارایی این فرمت ها به ازای ماتریس های بزرگ است. همچنین برای مقایسه کارایی پردازنده گرافیکی با پردازنده مرکزی، فرمت CSR نیز به ازای ماتریس های پراکنده با ابعاد مختلف بر روی این دو پردازنده پیاده سازی شده است. نتایج نشان می دهد که زمان اجرای الگوریتم ضرب برداری ماتریس های پراکنده در فرمت ELLR-T نسبت به سایر فرمت ها کمتر است. همچنین مقایسه زمان اجرای پردازنده گرافیکی و پردازنده مرکزی نشان می دهد که با افزایش اندازه ماتریس پراکنده، کارایی الگوریتم ضرب برداری ماتریس پراکنده بر روی پردازنده گرافیکی نسبت به پردازنده مرکزی افزایش می بابد.
كلمات كليدي : ضرب برداری ماتریس های پراکنده، پردازش موازی، پردازنده گرافیکی، پردازنده مرکزی
تاريخ دفاع : 1394-11-25