پروژه Part of Speech Tagging (پیاده سازی در نرم افزار متلب)
پروژه Part of Speech Tagging یا برچسب گذاری اجزای کلام یا گفتار (POS Tagging) ، عنوان پروژه ای است که در این ساعت از مطلب دی ال برای دانلود قرار داده ایم. این پروژه در نرم افزار متلب MATLAB پیاده سازی شده است. در ادامه توضیحات پروژه پیاده سازی برچسب گذاری اجزای گفتار در متلب و لینک دانلود پروژه آورده شده است.
برچسب گذاری اجزای کلام یا گفتار
اجزای کلام یا گفتار (POS یا Part of Speech Tagging) دسته بندی ها یا طبقهبندی های واژگان یا لغات خاصی هستند که در آن لغات بر اساس زمینه و نقش معنایی شان در دسته های مختلف قرار می گیرند.
دسته های اجزای کلام یا گفتار
معمولا کلمات در یکی از دستههای اصلی زیر قرار گیرند:
اسم (Noun): این دسته به طور معمول شامل کلماتی می شود که یک شی یا نهاد را معرفی میکنند که میتواند جاندار یا غیر جاندار باشد. به عنوان مثال گرگ، شیر، تلوزیون و غیره اسم هستند. نماد تگ POS برای اسم ها N می باشد.
فعل (Verb): افعال همان کلماتی هستند که اعمال، وضعیت ها یا رخدادهای خاصی را شرح می دهند به بیانی دیگر به بخشی از جمله گفته میشود که نشان دهنده کار انجام شده یا یک رویداد یا یک حالت باشد. طیف متنوعی از زیر دستههای افعال مانند افعال کمکی، افعال انعکاسی و افعال گذرا (و موارد بسیار دیگر) هستند.مانند است، بود، شد، خواندن، نوشتن، بردن، زیستن، بودن. نماد برچسب گذاری اجزای کلام (POS یا Part of Speech Tagging) برای فعل ها V می باشد.
صفت (Adjective): صفتها، کلمات یا واژه هایی هستند که برای توصیف یا تعیین کیفیت اسم ها به کار برده می شوند. عبارت کوه بلند یک اسم (N) دارد که با استفاده از یک صفت (ADJ ) به صورت بلند توصیف شده است. نماد برچسب گذاری اجزای گفتار یا تگ POS برای صفتها ADJ می باشد.
قید (Adverb): قید، کلمه یا گروهی از کلمات است که به فعل یا صفت یا اسم، مفهومی دیگر را علاوه بر مفهوم خود اضافه میکند و توضیحی درباره ی آن می دهد. عبارت کوه بسیار بلند دارای قید بسیار است که صفت بلند را تعدیل کرده و میزان بلندی آن را تعیین میکند. نماد تگ POS برای قیدها ADV است.
علاوه بر این دسته ها که برای اجزای کلام ذکر شد دسته های دیگری مانند ضمیرها، حرف های اضافه، حرف های ندا، حرف های ربط و … نیز وجود دارند.توضیحات بیشتر در داکیومنت پروژه آورده شده است.
در پروژه Part of Speech Tagging یا برچسب گذاری اجزای گفتار چه کارهایی انجام شده است؟
- توضیحاتی راجع به Tag set یا Tag set های معتبر موجود برای زبان فارسی بیان شده است.
- مجموعه داده های موجود زبان فارسی برای آموزش سیستم POS Tagger را نام برده شده و اطلاعات و مرجع مربوط به آنها بیان شده است.
- مشخص شده است که کدام یک از tag های معرفی شده در گزینه 1، در مجموعه داده انتخابی از گزینه 2 لحاظ نشده اند؟ این tag ها نام برده شده اند و تعدادی جمله از مجموعه داده انتخابی از گزینه 2 با استفاده از این tag ها به روزرسانی شده اند.
- پیاده سازی یک POS Tagger برای زبان فارسی
همچنین بخوانید: دانلود کتاب پردازش زبان گفتار (Spoken Language Processing)
پیاده سازی پروژه برچسب گذاری اجزای گفتار یا Part of Speech Tagging در نرم افزار متلب
در گام اول برنامه ای در نرم افزار متلب نوشته ایم تا بتواند داده ورودی را بخواند و جملات را در آن تشخیص دهد. (زیرا برای POS Tagging لازم است جایگاه کلمات در جمله را در نظر بگیریم)
سپس با الگوریتم مدل مارکف مخفی HMM و مجموعه داده انتخابی از گزینه 2 در بخش بالا به روزرسانی شده (با توجه به تعداد جمله خروجی گزینه 3 بخش بالا) سیستم را آموزش داده ایم.
و در گام آخر، بخشی از داده که به عنوان داده آزمون از قبل جدا نموده ایم را به سیستم داده ایم تا عمل برچسب گذاری اجزای گفتار را انجام دهد و عملکرد آن را ارزیابی نماییم.
تصاویری از پیاده سازی پروژه POS Tagging در متلب
همچنین بخوانید: پروژه طبقه بندی مقالات با استفاده از طبقه بندی بیز ساده (پردازش متن)
کارشناسان وب سایت MATLABDL قادر به انجام پروژه با موضوعات مشابه می باشند.
قیمت: ۱۲۰,۰۰۰ تومان
کد پروژه: 202159004
توضیحات : پیاده سازی در نرم افزار متلب انجام شده است.
کلمات کلیدی: پروژه Part of Speech Tagging,برچسب گذاری اجزای گفتار,نرم افزار متلب,برچسب گذاری اجزای کلام,پروژه POS Tagging,الگوریتم مدل مارکف مخفی
منبع : مطلب دی ال
دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.