separator

یادگیری ماشین بر بستر کلان‌داده

 دکتر نصیری در ابتدای کارگاه پس از تعریف مفاهیم تقلب و پولشویی گفت: در تقلب منبع پول سالم و روش به دست آوردن غیرقانونی است، ولی در پول‌شویی منبع پول ناسالم (غیرقانونی) و مجموعه تعامل مالی قانونی است. او چنین افزود: هدف از سیستم‌های ضدتقلب و پول‌شویی تنها کشف مدارک جعلی نیست؛ بلکه هدف اصلی، استخراج الگوهای مشکوک یا به عبارت بهتر استخراج الگوهای نامتعارف است. 
رئیس گروه سامانه‌های مدیریت تقلب شرکت خدمات انفورماتیک، با تاکید بر این نکته که سامانه‌های کشف تقلب حق قضاوت ندارند، گفت: روش‌های تقلب و پول‌شویی به صورت پویایی درحال تجدید هستند. از این رو لازم است سیستمی توسعه داد که در مقابل روش‌های متقلبانه جدید به صورت هوشمند عمل کند.
دکتر نصیری الگوهای نامتعارف تحلیل پیشرفته داده را به سه گروه مبتنی بر قواعد، مبتنی بر پروفایل و مبتنی بر یادگیری ماشینی تقسیم کرد و گفت: زیرسیستم مبتنی بر قواعد برای تقلب‌های آسان و الگوهای شناخته شده مناسب است. همچنین دارای سرعت بالا و پیچیدگی کم بوده، ولی در مقابل تقلب‌های جدید بسیار ضعیف است. در مقابل زیرسسیتم مبتنی بر پروفایل نسبت به روش‌های جدید تقلب نسبتاً کارآمد بوده، علت مشکوک شدن در آن مشخص است و نیز پیچیدگی متوسطی دارد، ولی از مفهوم تغییر رفتار (تغییرات رفتار واقعی یک ماهیت در طول زمان) پشتیبانی نمی‌کند، نیاز به تنظیم سطح حساسیت دارد و تقلب‌های پیچیده را پیدا نمی‌کند.
وی با اشاره به اینکه یادگیری ماشینی شاخه‌ای از هوش مصنوعی است، هدف از زیرسیستم یادگیری ماشینی را استخراج دانش و یادگیری الگوها در داده‌ها عنوان کرد. وی با تقسیم‌بندی یادگیری ماشینی به دو نوع تک‌کلاسه و چندکلاسه، تاکید کرد که بر اساس تجربه بهتر است مسئله به صورت تک‌کلاسه مدل‌سازی شود. 
دکتر نصیری با اشاره به اینکه اقلام اطلاعاتی در نظر گرفته شده در مدل اهمیت دارد، یکی از ضعف‌های سامانه‌های اطلاعاتی را در نظر گرفتن اقلام اطلاعاتی نادرست دانست و گفت‌: استخراج صحیح قلم اطلاعاتی کمک می‌کند تا رفتار اطلاعاتی به خوبی تشخیص داده شود. او افزود: می‌توان از ساختار تراکنش‌ها نیز در مواردی همچون درجه ورودی و خروجی و استخراج مشتریان هم‌بند قوی استفاده کرد. برای مثال می‌توان در تراکنش‌های مشکوک به تقلب، گروه‌های به‌هم‌وابسته را شناسایی کرد یا اینکه رفتار خرید مشتری را بر اساس تراکنش‌های او استخراج کرد. 
دکتر نصیری پس از ارائه توضیحاتی درباره کلان‌داده، در پایان به تشریح سامانه نظارتی ایمن (استخراج یکپارچه مبادلات نامتعارف) برای مدیریت تقلب پرداخت. او هدف از این سامانه را مدیریت تقلب در سامانه‌های پایا و ساتنا عنوان کرد و ابراز داشت: امیدواریم در گام بعد، گستره این سامانه به چکاوک نیز گسترش یابد.