استنتاج خودکار روابط بین اصطلاحات در اصطلاح‌نامه‌ فارسی علوم اسلامی با استفاده از شبکه‌های پیچشی گرافی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری، گروه علم اطلاعات و دانش‌شناسی، دانشکده روانشناسی و علوم تربیتی، دانشگاه خوارزمی، تهران، ایران.

2 استادیار، گروه علم اطلاعات و دانش‌شناسی، دانشکده روانشناسی و علوم تربیتی، دانشگاه خوارزمی، تهران، ایران

3 استادیار، گروه مهندسی کامپیوتر، دانشکده فنی‌ و ‌مهندسی، دانشگاه قم، قم، ایران.

4 استادیار، گروه مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه خوارزمی، تهران، ایران.

چکیده

هدف: پژوهش حاضر درصدد ارائه مدلی برای استنتاج خودکار روابط بین اصطلاحات در اصطلاح‌نامه‌ علوم اسلامی با استفاده از شبکه‌های پیچشی گرافی (GCN) بود، تا با استفاده از الگوریتم‌‌های جدید در حوزه یادگیری عمیق بتواند از اطلاعات موجود در اصطلاح‌نامه علوم اسلامی، سرعت، دقت و جامعیت را افزایش داده و موجب کاهش هزینه‌‌ها و در عین‌حال باعث بهبود روابط بین اصطلاحات شود.
روش: پژوهش حاضر، از روش شبکه‌‌های پیچشی گرافی که یکی از مهم‌ترین روش‌‌های مطرح در حوزه یادگیری عمیق بوده و قادرند در کنار توجه به ویژگی‌‌های هر گره، از الگوهای روابط در گراف نیز سود بجویند، استفاده کرده است. دیتاست مورد مطالعه عبارت است از کلیه اصطلاحات اصطلاح‌نامه علوم اسلامی، که از سال 1372 تا ابتدای 1400 تولید شده، و به صورت یک گراف در نظر گرفته ‌شده‌‌اند. اصطلاحات به عنوان رئوس و ارتباط بین اصطلاحات به‌عنوان یال‌‌های این گراف هستند و این گراف به عنوان ورودی، به شبکه پیچشی گرافی داده شده و مدلی برای استنتاج خودکار ارتباطات حاصل شده است. به منظور تجزیه و تحلیل خروجی‌‌های حاصل، از معیارهای AP و Roc استفاده شد.
یافته‌‌ها: یافته‌‌های پژوهش نشان داد که میانگین دقت مدل بدست آمده برای داده‌‌های تست، 75 درصد و همچنین امتیاز  Rocحاصل شده، برای داده‌‌های تست، 72 درصد می‌‌باشد، و با توجه به اینکه این روش در حوزه علوم اسلامی و اصطلاح‌نامه‌‌ها برای اولین بار مورد استفاده قرار، نتایج قابل قبول است.
نتیجه‌‌گیری: علی‌رغم چرخش نظر از اصطلاح‌نامه‌ها به هستی‌شناسی‌ها، هنوز هم استفاده از اصطلاح‌نامه‌‌‌ها، مخصوصاً در کشور ایران مورد توجه است. در مقایسه با پژوهش‌های قبلی، روش استفاده شده برای ساخت اصطلاح‌نامه، متفاوت بوده و نتایج بدست آمده موجب اطمینان بیشتری است و در نتیجه در اهداف مختلف کاربرد اصطلاح‌نامه ازجمله نمایه‌‌سازی خودکار، خروجی‌‌های بهتری بدست آمده است. شیوه‌‌های جدید در پردازش زبان طبیعی و یادگیری عمیق نیز ما را در بازیابی اطلاعات و نمایه‌‌سازی خودکار امیدوارتر می‌‌کند.
 

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Automatic Inference of Terminology Relationships in the Persian Islamic Sciences Thesaurus using Graph Convolutional Networks (GCNs)

نویسندگان [English]

  • Said Abolhasan Nezamdost 1
  • Ali Azimi 2
  • Amir Jalali 3
  • NosratAli Ashrafi Peyman 4
1 P.hD. Student, Department of Knowledge and Information Science, Kharazmi University, Tehran, Iran.
2 Assistant Professor, Department of Knowledge and Information Science, Kharazmi University, Tehran, Iran
3 Assistant Professor, Department of Computer Engineering, Qom University, Qom, Iran.
4 Assistant Professor, Department of Computer Engineering, Kharazmi University, Tehran, Iran.
چکیده [English]

Purpose: The present research aims to develop a model for automatically inferring the relationships between terms in the Thesaurus of Islamic Sciences using Graph Convolutional Networks (GCN). By employing new algorithms in the field of deep learning, the research seeks to enhance the efficiency of information retrieval in the Thesaurus of Islamic Sciences. To enhance accuracy and comprehensiveness, reduce costs, and improve relationships between terms.
Method: The current research employed used of convolutional networks method, networks, is are one of the crucial techniques methods in the field of learning. This method is capable of leveraging from the relationship patterns in the while also focusing on to the characteristics of each node. The dataset under study comprises all the terms from the thesaurus of Islamic sciences generated between 1994 and the early 2022, which are represented as a graph. The vertices represent the terms, and the edges represent the relationships between the terms in the graph. This graph is provided as input to the convolutional network, which then generates a model for the automatic inference of connections. And in order to analyze the obtained outputs, AP and ROC standards have been used.
Findings: The revealed showed the model achieved the average accuracy 75% and a Roc score of 72% obtained for the data. It is noteworthy to accept the results considering that this method was used for the first time in the field of Islamic sciences and thesauruses.
Conclusion: Despite shift in preference opinion thesauri thesauruses to ontologies, the use thesauri remains still of particularly especially in Iran. Compared to previous research, the method used to construct the thesaurus is different, resulting in more reliable outcomes. Consequently, we can expect improved results for various purposes, such as automatic indexing. New advancements in natural language processing and deep learning also give us hope for improvements in information retrieval and automatic indexing.
 

کلیدواژه‌ها [English]

  • Thesaurus Relations
  • Graph Convolutional Networks
  • Islamic Sciences Thesaurus
  • Machine Learning
باغبانی، ش. (1396). تکنیک‌ها و روش‌های یادگیری ماشین روی کلان‌داده. در: اصفهان: کنفرانس ملی فناوری‌های نوین در مهندسی برق و کامپیوتر.
تندپور، ا. (1383). اصطلاحنامه: ساختار و شکل. علوم اطلاع‌رسانی، 19(1-2).
حسن‌پور متی کلایی، س.ح.؛ سعادتی، ر. (1395). مروری بر آخرین تغییرات و بروزآوری‌ها در شبکه عصبی کانولوشن. در: کاشان: سومین کنفرانس ملی مهندسی برق و کامپیوتر سیستم‌های توزیع شده و شبکه‌های هوشمند.
رجبی، ت.؛ حسینی بهشتی، م.س.؛ صدیقی، م. (1398). روزآمدسازی و توسعۀ اصطلاح‌نامه‌های علمی و فنی ایرانداک. مدیریت اطلاعات، 5(1): 99-118.
کریمی، م. (20 مهر 1400). رویه سنّتی کار اصطلاح‌نامه علوم اسلامی. مصاحبه‌کننده: ا. نظام دوست.
موسایی، ع.ا. (1387). اصطلاحنامه چیست؟ قابل دسترس در:           https://vista.ir/w/a/16/i0uki
یعقوب‌‌نژاد، م.ه. (1375). درآمدی بر مبانی اصطلاحنامه علوم اسلامی. قم: بوستان کتاب.
CAPTCHA Image