اولویت‌بندی قابلیت‌های یادگیری ماشین برای شناسایی وبسایت‌های جعلی تجارت الکترونیکی: رویکرد دلفی فازی–MARCOS

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشیار، گروه مدیریت، دانشگاه قم، قم، ایران

2 کارشناسی ارشد، گروه مدیریت فناوری اطلاعات، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران

3 گروه مدیریت، دانشکده علوم اقتصادی و اداری، دانشگاه قم، قم، ایران

10.22091/stim.2026.14767.2319

چکیده

هدف: با گسترش سریع تجارت الکترونیکی و افزایش وابستگی کاربران به خریدهای آنلاین، تهدید وب‌سایت‌های جعلی نیز به‌طور چشمگیری رشد کرده است. این وب‌سایت‌ها با تقلید از برندهای معتبر، طراحی ظاهری مشابه، استفاده از نام‌های دامنه نزدیک به دامنه‌های اصلی و ایجاد تجربه کاربری فریبنده، کاربران را به واردکردن اطلاعات حساس مانند نام کاربری، گذرواژه، شماره کارت، کدهای تأیید و اطلاعات هویتی ترغیب می‌کنند. پیامد این حملات صرفاً مالی نیست و می‌تواند به خدشه‌دارشدن اعتماد عمومی، آسیب به اعتبار برندها، افزایش هزینه‌های رسیدگی به شکایات و حتی اختلال در زنجیره تأمین خدمات دیجیتال منجر شود. با وجود پژوهش‌های متعدد درباره کاربرد الگوریتم‌های یادگیری ماشین و یادگیری عمیق در تشخیص تقلب، خلأ اصلی ادبیات در نبودِ یک چارچوب کاربردی، اولویت‌بندی‌شده و تصمیم‌یار است؛ چارچوبی که مشخص کند سازمان‌ها در شرایط واقعی، با محدودیت‌های بودجه و منابع انسانی، باید کدام قابلیت‌ها و شاخص‌ها را در اولویت پیاده‌سازی قرار دهند. بسیاری از مطالعات پیشین بر بهبود دقت مدل‌ها تمرکز دارند، اما هم‌زمان ملاحظات اجرایی (عملی‌بودن و امکان استقرار)، اقتصادی (منافع و بازگشت سرمایه) و هزینه پیاده‌سازی و نگهداری را به‌صورت یکپارچه در نظر نمی‌گیرند. هدف این پژوهش پرکردن این شکاف از طریق ارائه چارچوبی نظام‌مند برای شناسایی، ارزیابی و اولویت‌بندی قابلیت‌های یادگیری ماشینی در تشخیص وب‌سایت‌های جعلی تجارت الکترونیکی است تا تصمیم‌گیران بتوانند با دیدی متوازن میان معیارهای فنی و مدیریتی، مسیر پیاده‌سازی را انتخاب کنند.
روش تحقیق: پژوهش حاضر از نوع کاربردی و کمی است. در گام نخست، با مرور نظام‌مند منابع علمی و صنعتی (بیش از ۱۵۰ مقاله و گزارش)، مجموعه‌ای از قابلیت‌های مرتبط با تشخیص وب‌سایت‌های جعلی استخراج شد. نتیجه این مرحله شناسایی ۲۵ قابلیت بود که طیفی از ابعاد مختلف را پوشش می‌داد: ویژگی‌های دامنه و URL (مانند طول دامنه، الگوهای نوشتاری و شباهت ساختاری)، محتوای وب‌سایت (متن، تصاویر، کلیدواژه‌ها و ساختار صفحه)، الگوهای رفتاری کاربران (نحوه پیمایش، کلیک‌ها و زمان توقف)، داده‌های تراکنش‌های مالی (الگوهای پرداخت و ناهنجاری‌ها) و تغییرات صفحات وب در طول زمان (به‌روزرسانی‌های غیرعادی و ناگهانی). سپس با بهره‌گیری از دلفی فازی، اهمیت و قابلیت استفاده هر قابلیت از دید خبرگان ارزیابی شد تا عدم‌قطعیت‌های قضاوت انسانی و اختلاف نظرها مدیریت شود. در این مرحله، ۹ قابلیت با امتیاز دیفازی بالاتر از ۰٫۷ به مرحله نهایی راه یافتند. در ادامه، برای اولویت‌بندی قابلیت‌ها، روش تصمیم‌گیری چندمعیاره مارکوس بر اساس سه معیار «عملی‌بودن»، «منافع مادی» و «هزینه استفاده/پیاده‌سازی» به کار گرفته شد و داده‌های خبرگان با ترکیب، نرمال‌سازی و وزن‌دهی تحلیل شدند تا رتبه نهایی هر قابلیت مشخص شود.
یافته‌ها: نتایج نشان داد پنج قابلیت، بیشترین اولویت و اثر را در شناسایی وب‌سایت‌های جعلی تجارت الکترونیکی دارند: (۱) طبقه‌بندی وب‌سایت‌ها به جعلی و واقعی با استفاده از الگوریتم‌های یادگیری ماشین و یادگیری عمیق، (۲) تحلیل تراکنش‌های مالی مشکوک و شناسایی الگوهای غیرعادی در جریان پرداخت، (۳) تشخیص تغییرات سریع و غیرطبیعی در صفحات وب و محتوای وب‌سایت، (۴) شناسایی روندها و الگوهای مشکوک در داده‌های تاریخی و رفتار کاربران با روش‌های پیش‌بینی و یادگیری مبتنی بر الگو، و (۵) تشخیص دامنه‌های جعلی و مشابه دامنه‌های معتبر از طریق تحلیل ویژگی‌های URL و شباهت‌های ساختاری. سایر قابلیت‌های منتخب نیز به بهبود دقت، کاهش نرخ خطا و مدیریت ریسک کمک می‌کنند، اما از نظر اولویت اجرایی و اثرگذاری کلی پایین‌تر قرار گرفتند.
نتیجه‌گیری: این پژوهش با ارائه یک چارچوب تصمیم‌یار و اولویت‌بندی‌شده، فاصله میان مطالعات الگوریتم‌محور و نیازهای اجرایی سازمان‌ها را کاهش می‌دهد و نشان می‌دهد رویکرد ترکیبی مبتنی بر دامنه، محتوا، رفتار کاربر و تراکنش مالی، اثربخشی بالاتری در تشخیص به‌موقع وب‌سایت‌های جعلی دارد. چارچوب پیشنهادی می‌تواند مبنایی برای طراحی، سرمایه‌گذاری و استقرار سامانه‌های امنیت دیجیتال در پلتفرم‌های تجارت الکترونیکی باشد. از محدودیت‌های پژوهش می‌توان به اتکا به داده‌های ثانویه و تعداد محدود خبرگان اشاره کرد؛ بنابراین پیشنهاد می‌شود در مطالعات آتی از داده‌های واقعی، نمونه بزرگ‌تر، اعتبارسنجی میدانی و تحلیل برخط برای افزایش دقت و قابلیت تعمیم نتایج استفاده شود.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Prioritizing Machine Learning Capabilities for Detecting Fake E-Commerce Websites: A Fuzzy Delphi–MARCOS Approach

نویسندگان [English]

  • majid nili ahmadabadi 1
  • Farzaneh Farzanian 2
  • Karim Ebrahimi 3
1 Associate Professor, Department of Management, Qom University, Qom, Iran
2 Master's degree, Department of Information Technology Management, Science and Research Branch, Islamic Azad University, Tehran, Iran
3 Department of Management, Faculty of Economic and Administrative Sciences, University of Qom, Qom, Iran
چکیده [English]

Objective: With the rapid expansion of e-commerce and the growing reliance of users on online shopping, the threat of fraudulent websites has significantly increased. These websites imitate reputable brands, replicate visual designs, use domain names similar to legitimate ones, and create deceptive user experiences to trick users into entering sensitive information such as usernames, passwords, credit card details, verification codes, and personal identification data. The consequences of such attacks are not limited to financial losses; they also damage public trust, harm brand reputation, increase complaint-handling costs, and may even disrupt digital service supply chains. Although numerous studies have examined the application of machine learning and deep learning algorithms in fraud detection, a major gap in the literature remains the absence of a practical, prioritized, and decision-support framework. Such a framework should guide organizations in selecting which capabilities and indicators to implement under real-world constraints, including limited budgets and human resources. Most previous studies primarily focus on improving model accuracy while overlooking practical feasibility, economic benefits, and implementation and maintenance costs in an integrated manner. The objective of this research is to fill this gap by developing a systematic framework for identifying, evaluating, and prioritizing machine learning capabilities for detecting fraudulent e-commerce websites. This framework enables decision-makers to adopt a balanced perspective that considers both technical and managerial criteria when planning implementation strategies.
Methodology: This study is applied and quantitative in nature. In the first stage, a systematic review of scientific and industry sources (over 150 articles and reports) was conducted to extract relevant capabilities for detecting fraudulent websites. As a result, 25 capabilities were identified, covering various dimensions: domain and URL features (e.g., domain length, lexical patterns, structural similarity), website content (text, images, keywords, and page structure), user behavioral patterns (navigation behavior, click patterns, dwell time), financial transaction data (payment anomalies and suspicious patterns), and web page changes over time (abnormal and sudden updates). Next, the fuzzy Delphi method was employed to assess the importance and usability of each capability from experts’ perspectives, allowing for the management of uncertainty and differences in judgment. In this phase, nine capabilities with a defuzzified score above 0.7 advanced to the final stage. Subsequently, the multi-criteria decision-making method (MARCOS) was applied to prioritize the selected capabilities based on three criteria: feasibility, financial benefits, and implementation cost. Expert data were aggregated, normalized, and weighted to determine the final ranking of each capability.
Findings: The results indicate that five capabilities have the highest priority and impact in detecting fraudulent e-commerce websites: (1) Classifying websites as fraudulent or legitimate using machine learning and deep learning algorithms; (2) Analyzing suspicious financial transactions and identifying abnormal payment flow patterns; (3) Detecting rapid and unusual changes in web pages and website content; (4) Identifying suspicious trends and patterns in historical data and user behavior using predictive and pattern-based learning techniques; and (5) Detecting fake domains and domains similar to legitimate ones through URL feature analysis and structural similarity assessment. Other selected capabilities also contribute to improving detection accuracy and reducing risk; however, they rank lower in terms of implementation priority and overall impact.
Conclusion: By providing a prioritized decision-support framework, this study bridges the gap between algorithm-focused research and the practical needs of organizations. The findings demonstrate that a combined approach integrating domain analysis, content analysis, user behavior monitoring, and financial transaction evaluation achieves higher effectiveness in the timely detection of fraudulent websites. The proposed framework can serve as a foundation for designing, investing in, and deploying digital security systems within e-commerce platforms. The study is limited by its reliance on secondary data and a relatively small number of experts. Future research is recommended to utilize real-world datasets, larger expert samples, field validation, and real-time analytical approaches to enhance accuracy and generalizability.

کلیدواژه‌ها [English]

  • E-commerce
  • fraudulent e-commerce
  • e-commerce website
  • machine learning
  • machine learning capabilities
  • Framework
CAPTCHA Image