عنوان
يادگيري مبتني بر شبکه عصبي مصنوعي براي محاسبه ميزان شباهت معنايي جملات متني
نویسنده (گان)
فکور شندي,حامد;ويسي,هادي
چکیده مقاله
در اين مقاله يک روش مبتني بر يادگيري ماشين با شبکه‌هاي عصبي مصنوعي براي محاسبه ميزان شباهت معنايي ميان دو جمله متني پيشنهاد شده است و به طور مجزا براي دو زبان انگليسي و فارسي مورد ارزيابي قرار گرفته است. براي يادگيري شباهت جملات، از يک دادگان موجود براي زبان انگليسي بهره گرفته شده است که شامل زوج جملاتي هستند که ميزان شباهت آنها توسط انسان امتياز‌دهي شده‌اند. براي انجام اين کاربراي هر دو جمله، مجموعه‌اي از ويژگي‌هاي آماري، نحوي و معنايي با استفاده از روش‌هاي پردازش زبان طبيعي و همچنين شبکه‌هاي واژگاني استخراج شده‌اند و ميزان شباهت جاکارد ويژگي‌هاي استخراج شده براي دو جمله مختلف توسط يک شبکه عصبي ياد گرفته شده است. در اين مقاله، علاوه بر تشابه‌يابي جملات انگليسي، اين کار به صورت مشابهي براي زبان فارسي نيز انجام شده است که بدين منظور ابتدا با الهام از دادگان انگليسي موجود، يک دادگان مشابه براي زبان فارسي تهيه شده است. پس از يادگيري شباهت جملات توسط شبکه عصبي، کارايي روش پيشنهادي با استفاده از معيارهاي ميانگين مربعات خطا و درصد اختلاف بين پاسخ واقعي و پاسخ شبکه، مورد ارزيابي قرار گرفت که بهترين نتيجه براي جملات انگليسي با اين دو معيار، به ترتيب برابر با 0.0375 و %13 و براي جملات فارسي، به ترتيب برابر با 0.0399 و %14 مي‌باشد. نزديکي نتايج حاصل در دو زبان، بيانگر توان يادگيري روش پيشنهادي در تشابه‌يابي متون و قابليت تعميم آن براي زبان‌هاي مختلف است.

متن کامل مقاله