خانه
نمونه کارها
نوشته ها
آرشيو
درباره
تماس
Rough Set Theory چیست ؟
17
مهر
1390
يکشنبه، ساعت 12:07
تئوری Rough Set در سالهای 1980 توسط Zdzislaw Pawlak توسعه یافت. این دیدگاه برای بیان و بررسی مسائلی است که در آنها عدم قطعیت و ابهام وجود دارد. معمولا ً برای پیدا کردن نا همگونیها و ارتباطات در اطلاعات به کار میرود. مهمترین ویژگیهای این تئوری عبارتند از:
الگوریتم بهینه برای پیدا کردن الگوها در داده ها دارد.
پیدا کردن روابطی که توسط روشهای آماری کشف نمیشوند.
امکان استفاده از اطلاعات کمی و کیفی.
پیدا کردن مجموعه minimal از داده ها که برای کلاس بندی مفید است ( مانند کم کردن ابعاد و تعداد اطلاعات ).
ارزیابی اهمیت داده ها.
تولید قوانین تصمیم گیری از روی اطلاعات.
سیستم های اطلاعاتی[1]
برای اجرای مجموعه های Rough ، اطلاعاتی که استفاده می شود معمولا ً به شکل جدول مسطح نمایش داده می شود. ستونها نمایش دهنده ویژگیها، سطرها نمایش دهنده اشیا و سلولها حاوی مقادیر ویژگی ها بر هر شی است. در لغتنامه ی مجموعه های Rough به این نوع جدول سیستم های اطلاعاتی گفته میشود. شکل زیر نمایش دهنده یک جدول با این مشخصات است:
در شکل فوق ، شش شی به همراه سه ویژگی وجود دارد. E نشان دهنده تجربه کارمندان فروش، Q کیفیت کالا و L وجود ایستگاه قطار در نزدیکی فروشگاه را مشخص میکند. همان طور که مشخص است فروشگاه های 2 و 3 مقادیری مشابه دارند و با استفاده از این مشخصات از هم قابل تفکیک نیستند[2]. رابطه زیر را رابطه ی تفکیک ناپذیر میگویند:
اگر xوy دو شی باشند و برای هر ویژگی که در مجموعه ی B باشد مقدار آن ویژگی در دو شی یکسان باشد آنگاه
را رابطه تفکیک ناپذیرB- می نامند.
در خیلی از مسائل کلاس بندی، خروجی از قبل مشخص است. برچسب کلاس را ویژگی تصمیم گیری[3] می نامند. سیستم اطلاعاتی که حاوی ویژگی تصمیم گیری باشد، سیستم تصمیم گیری[4] نام دارد.
در شکل فوق ستون pf (سود دهی ) ویژگی تصمیم گیری است. در این جدول فروشگاه های 2 و 3 ویژگی های یکسانی دارند اما از نظر سوددهی وضعیت مشابهی ندارند. به عبارت دیگر، ویژگی تصمیم گیری آنها با هم تفاوت دارد.
در شکل فوق مجموعه توانی ویژگی ها عبارتست از {E} , {Q} , {L} , {E,Q} , {E,L} , {Q,L} , {E,Q,L} . اگر {E,Q} را فرض کنیم، رابطه تفکیک ناپذیری
عبارتست از :
مجموعه {2,3} در رابطه فوق توسط E و Q تفکیک ناپذیر هستند و به یک کلاس هم ارزی تعلق دارند. روابط دیگر و کلاس های هم ارزی آنها به این شرح زیر است:
فرض کنید یک سیستم اطلاعاتی
که U مجموعه ی اشیا و A ویژگی ها است وجود داشته باشد و
و
. دو مجموعه به شرح زیر تعریف میشود :
که به آنها B-پایین[5] و B-بالا[6] تخمینی از X گفته میشود.
مجموعه های
و
احتمالا ً دارای اشیائی متعلق به X با توجه به تعریف B هستند. به
B-محدوده مرزی [7]روی X گفته میشود و حاوی اشیائی است که قطعا ً در X نیستند. یک مجموعه Rough است که با توجه به B، مجموعه مرزی آن تهی نباشد.
برای مثال اگر
یعنی X={1,3,6} (فروشگاه های 1 و 3 و 6 سوددهی دارند). اگر B={E,Q,L} فرض شود آنگاه :
طبق تعریف مجموعه های
و
برابر هستند با :
همان طور که مشخص است مجوعه مرزی تهی نیست. فروشگاه های 1و6 سود ده هستند، در فروشگاه های 1و2و3و6 فروشگاه هایی هستند که احتمالا ً سود دهی دارند. فروشگاه های 2 و 3 را نمی توان با B تعیین تکلیف کرد.
هم فروشگاه هایی هستند که قطعا ً سود دهی ندارند. میزان دقت مجموعه Rough را میتوان با عبارت زیر تعیین کرد :
تابع تعلق Rough
درجه ی تعلق x به X را می توان با تابع تعلق rough بیان کرد. این تابع تعلق درجه هم پوشانی مجموعه X و کلاس هم ارزی
را تعیین میکند.
با توجه به این تعریف مجموعه های بالا و پایین تخمین دارای توابع تعلقی مانند زیر میشوند :
وابستگی ویژگی ها[9]
در بررسی داده ها پیدا کردن رابطه ی بین ویژگی های شرطی و ویژگی تصمیم گیری اهمیت دارد. با استفاده از این وابستگی بین ویژگی ها می توان آنهایی که اهمیت ندارند را حذف کرد. اگر Td مجموعه ویژگی های تصمیم گیری باشد و Tc مجموعه ی ویژگی های شرطی، وابستگی بین آنها به این شکل بیان میشود Tc=>Td و معنی این است که تمام مقادیر تصمیم گیری از مقادیر شرطی بدست می آیند. البته حالت partial هم می تواند داشته باشد. تعریف رسمی برای این خاصیت عبارتست از :
اگر C و D زیر مجموعه های A باشند به طوری که اشتراک C و D تهی و اجتماع آنها A باشد، میگوییم D وابسته است به C با درجه k (0<k<1) و به این شکل نمایش داده میشود
اگر
اگر k برابر یک باشد یعنی D کاملا ً به C وابسته است. در مثال قبلی ویژگی تصمیم گیری (pf) با درجه
به مجموعه ویژگیهای {E,Q,L} وابسته است زیرا:
کاربرد
با استفاده از تئوری مجموعه های Rough میتوان از ابعاد ویژگی ها کم و آنهایی که در تصمیم گیری برای رسیدن به یک کلاس خاص استفاده ندارند را بی اهمیت کرد. برای مثال در شکل زیر خودروی توصیه شده با توجه قیمت، قدرت موتور و سن خریدار آمده است.
بعد از پیدا کردن روابط میان ویژگیها و حذف موارد بی ربط به ستون آخر، شکل زیر ساخته میشود. همانطور که در شکل زیر مشخص است جدول بسیار خلاصه تر شده و سریع تر میتوان کلاس بندی را انجام داد:
از این روش در ساختن قانونهای سازگاری، ساختن نمونه های انتزاعی و کلی تر(generalized) شده و آسانی در فراخوانی و بررسی صحت عملکرد بانک نمونه ها می توان استفاده کرد. به کمترین مجموعه ای که عمل جداسازی و کلاس بندی را بتواند انجام دهد reduct گفته میشود. در ترکیب روش فازی و Rough، مقادیر ویژگی ها به جای مقادیر اصلی به شکل فازی ذخیره می شوند (low/medium/high) ، سپس با استفاده از تئوری مجموعه های Rough قوانین جدا کننده ساخته می شود. برای هر ویژگی تابع تعلق مناسبی برای low/medium و high ایجاد می شود.
این مطالب از کتاب Foundation of Soft CBR آورده شده است. در آینده روش محاسبه و ساخت جدول آخر را شرح خواهم داد.
[1] Information Systems
[2] Indiscernible
[3] Decision Attribute
[4] Decision System
[5] B-lower approximation
[6] B-upper approximation
[7] B – Boundary Region
[8] Rough Membership
[9] Dependency of Attributes
بدون نظر
نام :
ايميل :
وب سايت :
ديدگاه :
عدد زير را وارد کنيد :
پيام شما بعد از بازبينی افزوده خواهد شد.
بيشترين بازديد
LINQ بخش دوم – LINQ to SQL
راه های افزایش بهره وری
LINQ بخش اول
اندیس در بانک اطلاعاتی
تبدیل اعداد انگلیسی به فارسی
چند راه ساده برای بهینه ...
متفرقه
لينک های روزانه
آرشيو
a brief guide to life
علت لغو پروازهای اروپا!!
نسخه جدید تقویم شمسی موبایل
Login by looking
simplify your workday
در حال اتمام