عنوان
IMD-DBSCAN: يک الگوريتم خوشه بندي مبتني بر چگالي افزايشي با قابليت افزودن خوشه هاي با چگالي متفاوت در محيط هاي انباره داده
نویسنده (گان)
زاده ده بالايي,علي;باقري,عليرضا;افشار,حامد
چکیده مقاله
خوشه بندي به‌عنوان يک روش يادگيري بدون نظارت، يکي از تکنيک هاي اصلي داده کاوي محسوب مي شود. انباره داده يک منبع داده خوب براي روش هاي داده کاوي ازجمله خوشه بندي است. در محيط هاي انباره داده، به‌صورت دوره اي حجمي از داده ها به داده هاي موجود اضافه مي شود. در اين حالت، خوشه هاي کشف‌شده از داده هاي موجود در انباره داده بايد به‌روز شوند. در اين مقاله يک الگوريتم خوشه بندي مبتني برچگالي افزايشي ارائه شده است که توانايي استفاده در محيط هاي انباره داده شامل داده هاي با چگالي متفاوت را دارد. الگوريتم ارائه‌شده علاوه بر افزودن افزايشي نقاط، توانايي افزودن افزايشي خوشه ها را نيز دارد. الگوريتم افزايشي ارائه‌شده با توجه به مقايسه اي که انجام داده ايم، بر مبناي يکي از بهترين الگوريتم هاي خوشه بندي مبتني برچگالي که قابليت کشف خوشه هاي با چگالي متفاوت را دارد، ارائه شده است. روش کار الگوريتم ارائه‌شده به اين صورت است که ابتدا نقاط جديد اضافه‌شده را با استفاده از الگوريتم MD-DBSCAN خوشه بندي مي کند و سپس خوشه هاي حاصل را به خوشه هاي موجود در انباره داده اضافه مي کند. ما الگوريتم پيشنهادي را بر روي مجموعه داده هاي استاندارد آزمايش کرده ايم. نتايج آزمايش ها نشان مي دهد که الگوريتم IMD-DBSCAN داراي دقت بالايي بوده و نسبت به الگوريتم MD-DBSCAN براي به روز کردن خوشه ها نياز به پرس وجو ناحيه اي بسيار کمتري دارد و درنتيجه داراي افزايش سرعت بسيار خوبي بوده است.

متن کامل مقاله