رده:زبان شناسی محاسباتی

از دانشنامه فناوری وب
پرش به: ناوبری، جستجو

زبان شناسی محاسباتی (Computational Linguistics) يكي از حوزه هاي میان رشته ای در علوم كامپيوتر مي باشد.


پردازش زبان‌های طبیعی یکی از زیر شاخه‌های با اهمیت در حوزه گسترده هوش مصنوعی، دانش زبان‌شناسی و یکی از نیازهای اساسی عصر فناوری جهت استفاده بهینه از منابع اطلاعاتی است. امروزه با رشد حجم مستندات تولید شده و نیاز به نگهداری، دسته بندی، بازیابی و پردازش ماشینی و سریع آنها توجه به پردازش زبان طبیعی بیش از پیش خودنمایی می کند. تلاش عمده در این زمینه، ماشینی کردن فرایند درک و برداشت مفاهیم بیان گردیده با یک زبان طبیعی انسانی می باشد. به تعریف دقیق‌تر پردازش زبان‌های طبیعی عبارت است از استفاده از رایانه برای پردازش زبان گفتاری و نوشتاری. با استفاده از آن می‌توان به ترجمه زبان‌ها پرداخت، از صفحات وب و بانک‌های اطلاعاتی نوشتاری جهت پاسخ دادن به پرسش‌ها استفاده کرد، یا با دستگاه‌ها مثلاً برای مشورت گرفتن به گفتگو پرداخت.[2] این‌ها تنها مثال‌هایی از کاربردهای متنوع پردازش زبان‌های طبیعی هستند. گفتنی ست هنوز سیستم چندان کارآمدی که پاسخگوی تمامی نیازهای ما باشد، برای پردازش زبان‌های طبیعی به وجود نیامده‌است. موانع اساسی - نیاز به درک معانی: رایانه برای آن که بتواند برداشت درستی از جمله‌ای داشته باشد و اطلاعات نهفته در آن جمله را درک کند، گاهی لازم است که برداشتی از معنای کلمات موجود در جمله داشته باشد و تنها آشنایی با دستور زبان کافی نباشد. مثلاً جمله حسن سیب را نخورد برای این که کال بود. و جمله حسن سیب را نخورد برای این که سیر بود. ساختار دستوری کاملاً یکسانی دارند و تشخیص این که کلمات کال و سیر به حسن برمی‌گردند یا به سیب بدون داشتن اطلاعات قبلی درباره ماهیت حسن و سیب ممکن نیست. - دقیق نبودن دستور زبان‌ها: دستور هیچ زبانی آن‌قدر دقیق نیست که با استفاده از قواعد دستوری همیشه بتوان به نقش هر یک از اجزای جمله‌های آن زبان پی برد. برای مثال در جمله کوتاه باز روی زمین نشست. نمی‌توان تشخیص داد که باز قید جمله به معنای دوباره است یا این که فاعل جمله به معنای نوعی پرنده شکاری است. زبان‌شناسی محاسباتی زبان‌شناسی رایانه‌ای یا زبان‌شناسی محاسباتی (Computational linguistics) حوزه‌ای میان‌رشته‌ای است که سعی دارد با بهره‌گیری از روش‌های آماری و مبتنی بر قاعده(rule-based)، از منظر محاسباتی به مدل‌سازی زبان طبیعی بپردازد. به خصوص از این روش‌ها برای حل مسائلی استفاده می‌کنند که ناشی از طولانی بودن جملات و زیاد بودن تعداد حالات ممکن برای نقش کلمات هستند. این روش‌ها معمولاً مبتنی بر نمونه‌های متنی و مدل‌های مارکف هستند. مقوله های زیر از جمله مباحثی هستند که در حیطه ی زبان‌شناسی محاسباتی قرار می گیرند:

- فرایافت concept و تجزیه زبان های برنامه نویسی : نوآم چامسکی توانست تشابه زبانهای طبیعی و زبانهای برنامه نویسی را به اثبات برساند. یعنی یک زبان رایانه‌ای مانند زبانهای طبیعی دارای یک دستور زبان و یک فرهنگ می‌باشد. تفسیر یک متن از تجزیهٔ واژه‌ها lexicon آغاز سپس با تجزیه نحو syntax و در آخر با تجزیه مفهوم semantic آن پایان می یابد.

- ترجمه ماشینی : این شاخه از زبان‌شناسی رایانه‌ای، زمان درازی کم اهمیت جلوه می‌کرد. اما امروزه یکی از موارد مورد علاقه پژوهشگران این رشته می‌باشد. پس از مرحلهٔ تجزیه واژه‌ها و نحو می باید تجزیهٔ مفهوم و سپس پرگماتیک را نیز افزود. در واقع این دو سعی در شناخت مفهوم خاص یک واژه در مکانی که ظاهر می‌شود را دارد.

- پرسش و پاسخ با زبانهای طبیعی : این ایده مدتی به‌عنوان پاسخی قانع کننده به مسئله ارتباط انسان و ماشین تلقی می‌شد. این دید در واقع جنبه ی وسیعتری از دستور زایشی چامسکی است.

- صرف محاسباتی : به مطالعات مربوط به ساختارهای درونی کلمات صرف گفته می‌شود. [2] اغلب دست‌آوردها و نتائج تحقیقات در صرف محاسباتی در سایه تلاشهای علمی انسان به منظور ایجاد و ساخت سیستم‌های پردازش زبان‌های طبیعی انسانی فراهم آمده است.

از جمله مهم ترین کارکردهای مهم پردازش زبان‌های طبیعی می توان موارد ذیل را نام برد: خلاصه‌سازی خودکار، استخراج اطلاعات، بازیابی اطلاعات، ترجمه ماشینی، تشخیص نوری نویسه‌ها، تشخیص گفتار، ویرایش و ...


منبع: [2] Crystal D.، The Cambridge Encyclopedia of Language، 2nd edition، Cambridge University Press، 1996. ISBN 0-521-55967-7


--اصغری (بحث) ‏۵ مهٔ ۲۰۱۴، ساعت ۱۲:۱۵ (IRDT)

زیررده‌ها

این ۳ زیررده در این رده قرار دارند؛ این رده در کل حاوی ۳ زیررده است.