رفتن به محتوای اصلی
امروز: ۰۵:۴۸:۰۳ ۲۰۲۵/۲۵/۰۶     ورود
EN - FA

برای تبلیفات در سایت

 

 

 

 

 

 

 

 

 

برای تبلیفات در سایت

 

 

 

 

 

 

 

 

برای تبلیفات در سایت

spam

اسپم های متنی، پیام هایی ناخواسته هستند که امروزه به صورت ایمیل یا پیام کوتاه دریافت می شوند. با توجه به افزایش حجم اسپم های تولیدی و با توجه به میزان ایمیل های متفاوتی نظیر شغلی، شخصی و سایر موارد که به طور روزانه دریافت می کنیم، بسیار مهم است که بتوانیم ایمیل های اسپم را شناسایی نماییم. از این رو هر پلتفرم ارسال و دریافت پیامی باید مجهز به یک سیستم تشخیص اسپم قوی باشد تا بتواند اسپم ها را در بدو ورود تشخیص داده و فیلتر کند. امروزه روش های متعددی برای تشخیص اسپم ارائه شده و اغلب در تشخیص اسپم ها موفق عمل می کنند. اما چالشی که در این حوزه هست، وجود False Positive‪(FP)‬ در تشخیص ها است. یعنی پیام های مشروع که به اشتباه به عنوان اسپم شناخته شده و فیلتر می شوند. یکی از روش های رایج و مؤثر تشخیص هرزنامه، استفاده از الگوریتم های یادگیری ماشین است. به عنوان یکی از شاخه های وسیع و پرکاربرد هوش مصنوعی و علوم کامپیوتر، یادگیری ماشین به تنظیم و اکتشاف شیوه ها و الگوریتم هایی می پردازد که براساس آنها رایانه ها و سامانه ها توانایی یادگیری پیدا می کنند. یادگیری تحت نظارت، یک روش عمومی در یادگیری ماشین است که در آن به یک سیستم، مجموعه ای از جفت های ورودی –خروجی ارائه شده و سیستم تلاش می کند تا تابعی از ورودی به خروجی را فرا گیرد. به روشهای عمومی یادگیری ماشین اغلب روشهای طبقه بندی نیز گفته می شود. برخی از این روش ها عبارتند از درخت تصمیم، ماشین بردار پشتیبان، نزدیکترین همسایه و شبکه های عصبی مصنوع. تحقیقات نشان می دهند با ترکیب روش های طبقه بندی پایه و اجرای رأی گیری وزن دار بین آنها، روش ترکیبی می تواند دقت بالاتری نسبت به طبقه بندهای بیزین، k-نزدیکترین همسایه و ماشین بردار پشتیبان داشته باشد. این تحقیق بر روی مجموعه داده های نظرات متنی در وبسایت آمازون آزمایش شده است و نتایج حاکی از بهبود طبقه بندی به کمک یادگیری دسته جمعی بوده است.

 

field_video
کپی رایت | طراحی سایت دارکوب