no-img
مشاوره پروپوزال و پايان نامه

پايان نامه در مورد خلاصه سازي گزينشي متون فارسي


مشاوره پروپوزال و پايان نامه
پکیج های آموزشی سایت
اطلاعیه های سایت

ادامه مطلب

PDF
پايان نامه در مورد خلاصه سازي گزينشي متون فارسي
pdf
اسفند ۱۲, ۱۳۹۵
611KB
280,000 ریال
سال ارائه: 89
280,000 ریال – خرید

پايان نامه در مورد خلاصه سازي گزينشي متون فارسي


توضيحاتي در مورد پايان نامه

در این پایان نامه، یک روش مبتنی بر خوشه بندي براي خلاصه سازي چندسندي متون پیشنهاد شده است. یک سامانهي خلاصهسازي گزینشی چندسندي، خلاصهسازي است که چند سند را به عنوان ورودي می گیرد و خلاصهاي تولید می کند که گزیدهاي از جمله هاي سندهاي اولیه است. اگر چه روش پیشنهادي محدود به حوزه نیست، اما ارزیابی آن روي یکمجموعه از خبرهاي ورزشی فارسی صورت گرفته است.
یکی از بخشهاي اصلی روش پیشنهادي، خوشهبندي جمله ها است. در خوشه بندي جمله ها دو راهکار براي دسته بندي هر چه بهتر جملهها بکار گرفته شده است، که عبارتند از:

استفاده از خوشه بندي سلسله مراتبی منفرد محدود براي خوشه بندي جمله ها
تولید خودکار بردارهاي همبستگی و بردارهاي واژه-بافت و استفاده از آنها براي تعیین شباهت بین جمله ها.
خوشه بندي سلسله مراتبی محدود با در نظر گرفت یک کران بالا براي اندازه ي خوشه ها، از به وجود آمدن خوشه هایی با اندازهي بیشتر جلوگیري می کند. استفاده از این روش خوشه بندي کمک شایانی به گزینش بهتر جمله ها میکند. همچنین، براي تعیین شباهت جمله ها که نقش مهمی در خوشه بندي دارد، دو روش پیشنهاد شده است. روش نخست، از همبستگی بین واژهها بهره میگیرد که بر مبناي رخداد همزمان واژه ها در یک پنجرهي با اندازه ثابت بدست می آیند. در روش دوم، از شباهت بین بردارهاي واژه-بافتواژهها استفاده میشود که بیانگر شباهتآنها است. بنابر مطالعه مراجع مرتبط در زبان فارسی، به نظر می رسد منابع نامبرده براي نخستین بار در سطح کاربردي براي زبان فارسی تولید شده اند.
بیشتر راهکارهاي در نظر گرفته شده که خاصزبان فارسی هستند، در بخشهاي پیشپردازش و تولید منابع زبانی صورت گرفته است. در بخش پیش پردازش، براي رفع مشکل وجود واژههاي به هم
چسبیده، روشی براي شناسایی و جداسازي آنها پیشنهاد شد. همچنین براي بهبود سرعت محاسبه شباهت بین بردارهاي واژه- بافت، بردارهاي جدیدي به نام بردارهاي هم بافت پیشنهاد شد. در بردار همبافت یک واژه، تعدادي از واژه هایی که بیشترین شباهت (بین بردارهاي واژه-بافت) را نسبت به واژهي اصلی دارند، وجود دارد. هر واژه در این بردار داراي یکوزن است که بیانگر میزان شباهت
آن با واژهي اصلی است.
روش ارزیابی استفاده شده در این پایاننامه، یک روش ارزیابی مستقیم است. این روش شامل دو بخش است. در بخش نخست، خلاصهي خودکار با تعدادي خلاصه ي مرجع که توسط افراد خبره
تهیه شده است مقایسه می شود و با اهمیت بودن جمله هاي موجود در خلاصه مورد ارزیابی قرار می گیرد. در بخشدوم، میزان اطلاعات تکراري در جمله هاي گزینش شده ارزیابی می شود.
نتایج حاصل از ارزیابی روش پیشنهادي نشان می دهند که استفاده از خوشهبندي سلسلهمراتبی محدود می تواند به همراه استفاده از همبستگی لغوي جهت تعیین شباهت جمله ها، بهترین کیفیت را نسبت به روش هاي مشابه حاصل کند. با بکارگیري روش پیشنهادي، کارایی از ۰,۶۵ به ۰,۸۶ (نسبت به روش MEAD بهبود یافت که این بهبود بدون بروز افزونگی (میزان افزونگی در دو روش یکسان است) (بیشتر حاصل شد.

 

توضيحات:

اين پايان نامه در دانشگاه علم و صنعت دفاع شده است و استاد راهنماي آن استاد آنالويي يكي از برجسته ترين اساتيد ايران در زمينه پردازش متن هستن

فهرست مطالب و فصل اول آن را مي توانيد رايگان دانلود نماييد.

فايل پايان نامه به صورت pdf است اما قابليت كپي كردن دارد.

آيدي تلگرام: mardin200@



درباره نویسنده

مديريت 70 نوشته در مشاوره پروپوزال و پايان نامه دارد . مشاهده تمام نوشته های

دیدگاه ها


پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *