پایان نامه استخراج قواعد فازی از دادههای GIS با استفاده از شبکه عصبی فازی جهت تشخیص بافتهای فرسوده مناطقه ۵ و ۱۱ شهر تهران
نویسنده: وحید بابازاده
استاد راهنما: دکتر پرویز ضیائیان فیروز آبادی
استاد مشاور: علی اکبر متکان
تاریخ شروع: ۱۳۸۸/۸/۲۸
دانشگاه: دانشگاه شهید بهشتی
مقطع: کارشناسی ارشد
رشته تحصیلی: سنجش ازدور و GIS
این پایان نامه مورد حمایت مرکز مطالعات و برنامه ریزی شهر تهران قرار گرفته است.
چکیده
هدف اصلی در این تحقیق به دست آوردن مدلی از دادههای GIS است که علاوه بر تخمین دقیق روابط بین ورودی و خروجی قابل فهم و تفسیر نیز باشد. روش ارائه شده بر روی دادههای مناطق ۵ و ۱۱ شهر تهران جهت تشخیص بافتهای فرسوده مورد آزمایش قرار گرفته است. از سیستمهای فازی به عنوان روشی جهت نمایش دانش کیفی استفاده شده است. شاخصهای فرسودگی و همچنین نمونههای آموزشی مورد نیاز جهت آموزش مدل از طریق کارشناسان حوزه برنامهریزی شهری و نقشههای طرح جامع سال ۱۳۸۵ تهران جمعآوری گردید. مدل فازی جهت رسیدن به دقت و تفسیرپذیری بالا از سه مرحله عبور کرده است. در مرحله اول با استفاده از الگوریتم خوشهبندی FCM ساختار اولیه مدل فازی شامل قوانین فازی و توابع عضویت مجموعههای فازی استخراج گردید. به منظور افزایش دقت مدل فازی، در مرحله دوم از یک شبکه عصبی- فازی CANFIS استفاده گردید. سیستم فازی حاصل از دقت بالایی (RMS=0.0045) برخوردار بوده اما تفسیر آن بسیار مشکل میباشد. از الگوریتمهای ژنتیک در مرحله سوم جهت افزایش قابلیت تفسیرپذیری مدل فازی استفاده گردید. مدل فازی نهایی دارای ۱۰ قانون فازی است که وزن هر یک از این قوانین نیز توسط الگوریتم ژنتیک مشخص گردیده است. میزان تأثیرپذیری هر یک از شاخصهای فرسودگی بر مدل توسط ماتریس حساسیت بدست آمده از سیستم عصبی- فازی CANFIS تعیین گردید. با اعمال تمامی دادهها به مدل، میزان عضویت هر یک از بلوکهای شهری به طبقات فرسودگی کم، متوسط، زیاد و بسیار زیاد مشخص گردید. طبقه با بیشترین میزان عضویت به عنوان طبقه نهایی آن بلوک در نظر گرفته شد.
نتایج به دست آمده حاکی از آن است که روش ارائه شده در این تحقیق قابلیت تعمیم به مسائلی را که در آن دانش کافی از سیستم هدف در دسترس نمیباشد داراست و از دقت و تفسیرپذیری بالایی برخوردار است.
کلمات کلیدی: سیستم اطلاعات جغرافیایی، استنتاج قوانین فازی، الگوریتم خوشهبندی FCM، سیستم عصبی- فازی CANFIS، الگوریتم ژنتیک، بافت فرسوده شهری، تهران
خلاصه پروژه:
هدف اصلی در این تحقیق به دست آوردن مدلی از دادههای GIS است که علاوه بر تخمین دقیق روابط بین ورودی و خروجی قابل فهم و تفسیر نیز باشد. روش ارائه شده بر روی دادههای مناطق ۵ و ۱۱ شهر تهران جهت تشخیص بافتهای فرسوده مورد آزمایش قرار گرفته است. از سیستمهای فازی به عنوان روشی جهت نمایش دانش کیفی استفاده شده است. شاخصهای فرسودگی و همچنین نمونههای آموزشی مورد نیاز جهت آموزش مدل از طریق کارشناسان حوزه برنامهریزی شهری و نقشههای طرح جامع سال ۱۳۸۵ تهران جمعآوری گردید. مدل فازی جهت رسیدن به دقت و تفسیرپذیری بالا از سه مرحله عبور کرده است. در مرحله اول با استفاده از الگوریتم خوشهبندی FCM ساختار اولیه مدل فازی شامل قوانین فازی و توابع عضویت مجموعههای فازی استخراج گردید. به منظور افزایش دقت مدل فازی، در مرحله دوم از یک شبکه عصبی- فازی CANFIS استفاده گردید. سیستم فازی حاصل از دقت بالایی (RMS=0.0045) برخوردار بوده اما تفسیر آن بسیار مشکل میباشد. از الگوریتمهای ژنتیک در مرحله سوم جهت افزایش قابلیت تفسیرپذیری مدل فازی استفاده گردید. مدل فازی نهایی دارای ۱۰ قانون فازی است که وزن هر یک از این قوانین نیز توسط الگوریتم ژنتیک مشخص گردیده است. میزان تأثیرپذیری هر یک از شاخصهای فرسودگی بر مدل توسط ماتریس حساسیت بدست آمده از سیستم عصبی- فازی CANFIS تعیین گردید. با اعمال تمامی دادهها به مدل، میزان عضویت هر یک از بلوکهای شهری به طبقات فرسودگی کم، متوسط، زیاد و بسیار زیاد مشخص گردید. طبقه با بیشترین میزان عضویت به عنوان طبقه نهایی آن بلوک در نظر گرفته شد.
نتایج به دست آمده حاکی از آن است که روش ارائه شده در این تحقیق قابلیت تعمیم به مسائلی را که در آن دانش کافی از سیستم هدف در دسترس نمیباشد داراست و از دقت و تفسیرپذیری بالایی برخوردار است.
اهداف تحقیق
– ایجاد مدلی خودکار جهت استخراج دقیق قوانین فازی از دادههای GIS
– تشخیص میزان واقعی فرسودگی بافتها به منظور مداخله صحیح در آنها
نتیجه گیری
با توجه به روندنمای مطرح شده در تحقیق مدل فازی ، به منظور رسیدن به دقت و شفافیت مناسب از سه مرحله عبور مینماید. در مرحله اول الگوریتم خوشهبندی FCM تنها پارامترهای کلی سیستم فازی را استخراج نموده و به همین دلیل از دقت مناسب جهت تخمین روابط بین دادههای ورودی و خروجی برخوردار نمیباشد. همچنین بدلیل پوشش زیاد توابع عضویت مجموعههای فازی با یکدیگر مدل حاصل از شفافیت لازم برخوردار نمیباشد.
در مرحله دوم الگوریتم آموزشی Backpropagation در سیستم عصبی- فازی CANFIS شروع به تنظیم پارامترهای محلی مدل فازی مینماید. جهت تعیین درجه پلینومیال مناسب، دادهها به دو بخش دادههای آموزشی و دادههای Validation تقسیم شدند. الگوریتم BP پس از رسیدن به درجه پلینومیال مناسب متوقف میگردد و وزنهای بدست آمده بعنوان پارامترهای توابع عضویت مجموعههای فازی در نظر گرفته میشوند. مدل فازی حاصل بدلیل تنظیم دقیق پارامترهای محلی دارای دقت بالایی بوده اما به علت تلفیق کامل توابع عضویت، تعداد قوانین فازی افزایش یافته و از شفافیت مدل کاسته شده است.
به منظور افزایش قابلیت تفسیرپذیری مدل از عملگرهای ژنتیک جهت کاهش قوانین و توابع عضویت فازی که تأثیر چندانی در کل سیستم ندارند استفاده شده است. الگوریتمهای ژنتیک در شناسایی ساختار و پارامترهای کلی سیستم بسیار خوب عمل کرده اما در تنظیم پارامترهای محلی دچار ضعف هستند. از این رو مقادیر ژنهای افراد نسل اول در الگوریتم ژنتیک را پارامترهای بدست آمده در مرحله دوم تشکیل میدهد. با اجرای الگوریتم ژنتیک بر روی مدل فازی تعداد قوانین کاهش یافته و به عدد ۱۰ میرسد. در ضمن توابع عضویت فازی از حالت تخمینی به حالت تشریحی تبدیل شدهاند.
سیستم استنتاج فازی حاصل دارای دقت و شفافیت بسیار خوبی بوده و آمادگی تخمین میزان فرسودگی تمامی بلوکهای مناطق مورد مطالعه را دارا میباشد. همچنین از این روش میتوان میزان تأثیرگذاری هر یک از ورودیها را بر کل سیستم تعیین نمود.
پیشنهادات
مهمترین نکتهای که به ذهن خطور میکند چگونگی بسط و تعمیم این روش مدلسازی در حل مسائل دیگر است. در این خصوص میتوان به جنبههای زیر اشاره کرد:
دادههای آموزشی. شبکههای عصبی- فازی نیازمند مجموعه دادههای آموزشی خوب هستند که بایستی نماینده شایستهای از کل مجموعه دادهها باشند. در غیر اینصورت، اگر تفاوت روشن و ملموسی بین دادههای در حال آموزش وجود نداشته باشد، استخراج مفید قوانین مشکل خواهد بود. علاوه بر این، چنین دادههایی میتوانند منجر به همگرایی غیرقابل پیشبینی یادگیری شبکه شوند که اجرای موفق و کاربرد موفقیتآمیز آن را با تهدید روبرو میکند.
انتخاب عناصر ورودی. نحوه انتخاب ورودیهای شبکه در این تحقیق مورد بررسی قرار نگرفته است. نیاز به این مسئله هنگام پرداختن به دادههایی با ابعاد زیاد احساس میگردد. تعداد زیاد عناصر ورودی افزایش زمان آموزش شبکه و همچنین اغلب عدم همگرایی آن را در پی خواهد داشت. روشهای بسیاری جهت رفع این مشکل وجود دارد که الگوریتمهای ژنتیک از جمله این روشهاست. از الگوریتم ژنتیک میتوان برای یافتن مؤثرترین ورودیها استفاده کرد.
مسائل پیچیده دنیای واقعی. به دلیل قابلیت بالای سیستمهای عصبی- فازی در تخمین ارتباط بین پدیدههای ورودی و خروجی و همچنین ارزیابی قدرت و ضعف متدولوژی ارائه شده در این تحقیق بهتر است از این روش در حل مسائلی در دنیای واقعی که دارای پیچیدگیهای بسیار زیاد میباشند و مدلسازی آن توسط یک کارشناس بسهولت امکانپذیر نمیباشد مورد استفاده قرار گیرد.
دیدگاهی بنویسید.
بهتر است دیدگاه شما در ارتباط با همین مطلب باشد.