امروزه حجم زیادی از اطلاعات در شبکه ارتباطی جهانی وجود دارد.پیدا کردن داده های مورد نظر کاربر روی وب در یک روش بهنگام و سودمند یکی از مسایل چالش برانگیز است. این مقاله تکنیکی را برای حذف وندها و تاثیر آن بر روی تشخیص مستندات متشابه ارائخ کرده است.این روش با بررسی وند ها و استثنائات آن ها در زبان فارسی حدود 300 وند و ترکیبات آنها را استخراج و با حذف آنها از متن نتایج بهتری را برای مشابهت یابی متون فارسی بدست آورده است.ارزیابی های ما نشان دادند که حذف وندها از متون فارسی روشهای تشابه متن را بهتود ...