پیکره واژگان یا WordNet یک مجموعه ی نسبتا بزرگ از لغات و ارتباط آن ها در ساختار متون است. وردنت در حقیقت رابطه معنایی بین دو کلمه را بیان می کند. به عنوان مثال کبوتر از نوع پرنده است و پرنده یک نوع حیوان است و جیوان یک نوع جاندار است. از یک پیکره متن کاوی، تحلیل معنایی، اعتبارسنجی نظریات و بررسی درستی قواعد زبانی استفاده می شود. وردنت در واقع شبکه ای معنایی از بیش از یکصد هزار مفهومی است که بوسیله روابط معنایی به هم مرتبط هستند. پیکره زبانی می تواند یک زبانه یا چند زبانه باشد. وردنت انگلیسی یا واژگانی پرینستون (PWN) نخستین بار توسط جرج میلر و همکارانش در سال ۱۹۸۶ در آزمایشگاه علوم شناختی دانشگاه پرینستون بر اساس واژگان ذهنی و در حوزه ی پژوهش های روانشناسی زبان طراحی و ایجاد شد. آخرین نسخه از شبکه واژگان، نسخه ۳ می باشد که در سال ۲۰۰۶ منتشر شد. پایگاه داده این نسخه شامل تقریباً ۱۵۰۰۰۰ لغت است که در بیش از ۱۱۵۰۰۰ گروه هم خانواده تقسیم شده است.
برای اطلاعات بیشتر در خصوص این مطلب وب سایت بسیار خوب http://bigdata-ir.com مقاله ای بسیار کامل و مفید منتشر کرده است که می توانید آن را در لینک زیر مطالعه نمایید:
۰ پاسخ به "تعریف پیکره واژگان WordNet چیست؟"