نوع مقاله : مقاله مروری
نویسندگان
1 گروه مهندسی فناوری اطلاعات، دانشکده مهندسی صنایع و سیستمها، دانشگاه تربیت مدرس، تهران، ایران
2 گروه مدیریت سیستم و بهرهوری، دانشکده مهندسی صنایع و سیستمها، دانشگاه تربیت مدرس، تهران، ایران
3 گروه مهندسی صنایع، دانشکده مهندسی صنایع و سیستمها، دانشگاه تربیت مدرس، تهران، ایران
4 گروه مهندسی سیستمهای اقتصادی و اجتماعی، دانشکده مهندسی صنایع و سیستمها، دانشگاه تربیت مدرس، تهران، ایران
چکیده
کلیدواژهها
موضوعات
عنوان مقاله [English]
نویسندگان [English]
This paper aims to provide is to identify and categorize the most important data quality problems and determine the approaches proposed to solve this challenge in the process of mining. The method used in this research is a systematic review that has been conducted to analyze all valid evidence to answer the research questions. In this way, we reviewed and explored 102 academic research between 2007 and 2021, including studies published in conferences, journals, and a number of dissertations. The results showed that 20 data quality issues were reviewed in the literature. We categorized these issues into five levels: trace, event, case, activity, and timestamp, and identified four fundamental approaches used by studies to evaluate and address data quality issues in process mining, including: 1) data quality frameworks 2) preprocessing 3) anomaly detection 4) repair. Despite appropriate efforts to improve the quality of process mining input data, it is proposed to explore and develop new methods for high complexity data in real business processes.
کلیدواژهها [English]
ارسال نظر در مورد این مقاله