آموزش داده کاوی با وکا weka
Home آموزش داده کاوی با وکا weka
آمورش داده کاوی
داده کاوی مجموعه تکنیک هایی می باشد که پایگاه داده های بزرگ را به منظور دستیابی به دانش، تحلیل می کند. به منظور داده کاوی امروزه از روش های ماشینی و یا نیمه ماشینی استفاده می شود که دلیل آن هم تفاوت عمده در مقیاس، وسعت و گوناگونی زمینهها و کاربردها، و نیز ابعاد و اندازههای دادههایی می باشد که امروز مورد استفاده قرار می گیرد. داده کاوی یا Data Mining در اصل به معنای استخراج اطلاعات یا الگوهای عملکرد و روابط مشخص در میان داده ها و همینطور پایگاه های داده می باشد.
آموزش داده کاوی با استفاده از WEKA
داده کاوی چیست؟
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
داده کاوی مجموعه تکنیک هایی می باشد که پایگاه داده های بزرگ را به منظور دستیابی به دانش، تحلیل می کند. به منظور داده کاوی امروزه از روش های ماشینی و یا نیمه ماشینی استفاده می شود که دلیل آن هم تفاوت عمده در مقیاس، وسعت و گوناگونی زمینهها و کاربردها، و نیز ابعاد و اندازههای دادههایی می باشد که امروز مورد استفاده قرار می گیرد. داده کاوی یا Data Mining در اصل به معنای استخراج اطلاعات یا الگوهای عملکرد و روابط مشخص در میان داده ها و همینطور پایگاه های داده می باشد.
داده کاوی، بهره گیری از ابزار های موجود جهت کسب دانش
داده کاوی بهرهگیری از ابزارهای تجزیه و تحلیل دادهها به منظور کشف الگوها و روابط معتبر گفته میشود که استفاده از این ابزارها منجر به یافتن سریع مدلهای آماری مورداستفاده درداده، مدلهای آماری و الگوریتمهای ریاضی میشود که این کار این به صورت خودکار و یا بر اساس تجربهای که از طریق شبکههای عصبی یا درختهای تصمیم گیری به دست میآورند، انجام می دهند. داده کاوی علاوه بر گردآوری و مدیریت داده های انبوه، تجزیه، تحلیل اطلاعات و پیش بینی را نیز انجام میدهد که پارامتر های گوناگونی را در نظر می گیرد:
۱) قواعد انجمنی یا Association که شامل الگو هایی می باشد که یک رویداد به رویدادی دیگر ارتباط پیدا می کند.
۲) ترتیب یا Sequence: ترتیب اجرای رویداد ها را پیگیری می کند.
۳) پیش بینی یا Prediction که پیش بینی یک متغیر پیوسته را انجام می دهد.
۴) طبقه بندی یا Classification که رده های موجود در داده ها را تعریف می کند و نسبت به یکریگر متمایز می کند با این هدف که بتوان از این مدل برای پیش بینی رده رکوردهایی که برچسب رده آنها ناشناخته میباشد، استفاده نمود.
۵) خوشه بندی یا Clustering که مجموعه ای از رکورد ها که شباهت بیشتری را نسبت به یکدیگر دارد را در یک گروه قرار می دهد.
۶) مصور سازی یا visualization که داده های به دست آمده را شبیه سازی می کند.
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
ابزار های داده کاوی
۱) کلمنتاین Clementine
۲) نرم افزار Rapid Miner
۳) نرم افزار WEKA
WEKA ابزاری متن باز برای داده کاوی در جاوا
WEKA را می توان یکی از قدرتمند ترین ابزار های موجود جهت داده کاوی دانست که یک کتابخانه متن باز می باشد که به کاربر این امکان را می دهد تا با استفاده از امکانات زبان جاوا، داده های خود را پردازش کند. WEKA توابع مختلف را برای داده کاوی در اختیار کاربر قرار میدهد. مزیت استفاده از این کتابخانه این می باشد که ابزار های متنوعی جهت پیاده سازی الگوریتم های داده کاوی را به صورت آماده دارد.
مفاهیم داده کاوی
اعمال فیلتر بر روی داده ها
حذف ویژگی های غیرمفید
گسسته سازی ویژگی های عددی
ایجاد داده تصادفی
انتخاب ویژگی
خوشه بندی
روش های انتخاب خوشه
دسته بندی
ارزیابی مدل و تست
آشنایی با ماتریس Confusion
آشنایی با مشخصه عملکرد سیستم
قوانین انجمن
آماده سازی محیط نرم افزاری برای شروع به کار با WEKA
نصب جاوا
نصب Eclipse
اتصال WEKA با Ecli
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
pse
درونریزی داده
آشنایی با نوع داده ARFF
تعریف ویژگی
آشنایی با ساختار داده ها
ایجاد مجموعه داده در زمان اجرا
ذخیره داده در قالب ARFF
اعمال فیلتر بر روی داده ها
گسسته سازی ویژگی ها
ابزار اعمال فیلتر دسته بندی FilteredClassifier
انتخاب ویژگی در WEKA
Information Gain و کاربرد آن در انتخاب ویژگی
بررسی مولفه های اصلی
AttributeSelectedClassifier و انتخاب خاص دسته بندی کننده
ایجاد یک دسته بندی کننده و آموزش آن
ایجاد دسته بندی کننده با درخت تصمیم گیری یا Decision Treesb.
ایجاد دسته بندی کننده با استفاده از ماشین بردار پشتیبان یا SVM
مدل های دیگر دسته بندی کننده
ایجاد یک دسته بندی کننده اختصاصی
نمایش نتیجه
نمایش گرافیکی درخت به کاربر
بررسی و ارزیابی مدل ها
بررسی مجموعه داده ها و تست
نمایش نتایج آماری
جداسازی داده یادگیری
اعتبارسنجی متقابل k-fold
ماتریس Confusion
منحنی ROC
ذخیره مدل با استفاده از Serializable
بازگردانی مدل با استفاده از deserializable
رگرسیون
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
کلاس Zero
کلاس REPTree
کلاس SMOreg
کلاس MultilayerPerceptron
قوانین ارتباطی
الگوریتم Apriori و کشف قوانین ارتباطی
خوشه بندی
الگوریتم EM و نحوه خوشه بندی
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
دسته بندی کننده خوشه ای
خوشه بندی افزایشی
:: موضوعات مرتبط:
1111111 ,
,
:: بازدید از این مطلب : 155
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0