
ترجمه ماشینی یکی از شاخه های پرکاربرد و پیچیده در پردازش زبان طبیعی است. با توجه به گسترش روزافزون اسناد تحت وب، درخواست استفاده از سرویس های ترجمه ماشینی بسیار بالاست و شرکت های بزرگ فعال در این حوزه به طور مداوم در حال تلاش برای بهبود محصولات خود هستند. در سال های گذشته رویکردهای متفاوتی برای این مسئله ارائه شده است که هر کدام نقاط قوت و ضعف خاص خود را دارند. از میان این رویکردها می توان به ترجمه مبتنی بر قاعده، ترجمه آماری، ترجمه مبتنی بر مثال و ترجمه بر پایه شبکه های عصبی اشاره کرد. همچنین با ترکیب رویکردهای مختلف روش های ترکیبی ارائه د اد. این روش ها سعی در هم افزایی نقاط مثبت رویکردهای ترکیب شده دارند. در روش های ترکیبی معمولا یکی از رویکردهای عنوان شده به عنوان رویکرد اصلی انتخال می شود و فرایند ترجمه با تکیه بیشتر بر آن روش انجام می شود و روش های استفاده شده دیگر برای بهبود و کم کردن خطاهای روش پایه به کار می آیند. از روش های ترکیبی متداول در ترجمه ماشینی می توان به اضافه کردن اطلاعات زبانی و نحوی به مترجم های آماری و یا استفاده از عبارات استخراج شده در مترجم آماری برای غنی سازی مترجم مبتنی بر قاعده اشاره کرد. رویکرد مبتنی بر قاعده به عنوان قدیمی ترین رویکرد در حوزه ترجمه ماشینی شناخته می شود و بر پایه مجموعه ای از قواعد که معمولا توسط انسان ایجاد شده است استوار است. این مجموعه قواعد نحوه انتقال نحوی و لغوی از یک زبان به زبان دیگر را مدل سازی می کنند. از آنجایی که این مجموعه قواعد با نظارت انسان تولید می شوند استفاده از این رویکرد هزینه بسیار زیادی به همراه دارد. در ازای این هزینه، نتایج تولید شده توسط مترجم های مبتنی بر قاعده از نظر دستور زبان صحیح تر هستند و ترتیب کلمات در آنها بهتر رعایت شده است. این در حالی است که مترجم های آماری از نظر انتخاب معادل مناسب برای کلمات در زبان مقصد، معمولا بهتر از مترجم های مبتنی بر قاعده عمل می کنند.