استنتاج خودکار روابط بین اصطلاحات در اصطلاح‌نامه‌ فارسی علوم اسلامی با استفاده از شبکه‌های پیچشی گرافی (GCN)

نوع مقاله : مقاله پژوهشی

نویسندگان

1 علم اطلاعات و دانش شناسی، دانشکده روانشناسی و علوم تربیتی، دانشگاه خوارزمی،تهران، ایران.

2 گروه علم اطلاعات و دانش‌شناسی، دانشکده روانشناسی و علوم تربیتی، دانشگاه خوارزمی، تهران، ایران

3 گروه مهندسی کامپیوتر، دانشکده فنی‌و‌مهندسی، دانشگاه قم، قم،ایران

4 گروه مهندسی کامپیوتر،دانشکده مهندسی برق و کامپیوتر، دانشگاه خوارزمی، تهران، ایران

چکیده

چکیده

هدف: پژوهش حاضر به دنبال ارائه مدلی برای استنتاج خودکار روابط بین اصطلاحات در اصطلاح‌نامه‌ علوم اسلامی با استفاده از شبکههای پیچشی گرافی (GCN) می‌باشد تا با استفاده از الگوریتم‌های جدید در حوزه یادگیری عمیق بتواند از اطلاعات موجود در اصطلاح‌نامه علوم اسلامی، سرعت، دقت و جامعیت را افزایش و موجب کاهش هزینه‌ها و در عین حال باعث بهبود روابط بین اصطلاحات شود.

روش شناسی: پژوهش حاضر، از روش شبکه های پیچشی گرافی که یکی از موثرترین روش‌های مطرح در حوزه یادگیری عمیق است و قادر است که در کنار توجه به ویژگی‌های هر گره از الگوهای روابط در گراف نیز سود بجویند، استفاده کرده است. به این منظور اصطلاحات و مستند حاوی نمایه‌های آنها توسط یک مدل تعبیه‌ساز به بردارهای معنایی تبدیل خواهند شد که در آن نزدیکی دو بردار به معنای نزدیکی مفاهیم دو متن ورودی می‌باشد. این بردارها مقادیر اولیه رئوس گراف را تشکیل خواهند داد. در هر مرحله از آموزش مدل با در نظر گرفتن دو بردار ورودی و همچنین تجمیع بردار همسایگان هر گره تلاش خواهد کرد وجود یا عدم وجود یال بین آن دو گره را پیش‌بینی کند. مدل به واسط روش انتشار رو به عقب آموزش داده شده تا تابع هزینه آن کمینه شود. دیتاست مورد مطالعه عبارت است از کلیه اصطلاحات اصطلاح‌نامه علوم اسلامی. که از سال 1372 تا ابتدای 1400 تولید شده، که به صورت یک گراف در نظر گرفته ‌شده‌اند. اصطلاحات بعنوان رئوس و ارتباط بین اصطلاحات بعنوان یال‌های این گراف هستند و این گراف به عنوان ورودی به شبکه پیچشی گرافی داده شده و مدلی برای استنتاج خودکار ارتباطات حاصل شده است. و به منظور تجزیه و تحلیل خروجی‌های حاصل شده از معیارهای AP و Roc استفاده شده است.

نتایج: داده‌های ما به دو بخش اصلی تقسیم می‌شوند. بخش اول پاراگراف‌هایی هستند که در یک کتاب وجود دارند و مورد دوم نمایه‌های کتاب یا همان کلمات کلیدی کتاب هستند. هدف این است که مدل هوش مصنوعی موجود بتواند ارتباط میان نمایه‌ها و متون و پاراگراف‌های مرتبط با نمایه را یاد گرفته و بتواند ارتباط آنها را به ما نشان بدهد. یک شبکه عصبی شامل یک لایه ورودی و یک لایه خروجی و تعدادی لایه مخفی است. از طریق لایه ورودی داده‌ها وارد شبکه عصبی شده و به وسیله لایه خروجی، خروجی تولید می گردد. در میان این دو لایه تعدادی لایه دیگر وجود دارند که باعث افزایش پیچیدگی شبکه و بالا رفتن دقت مدل می‌شوند که به آن‌ها لایه‌های مخفی گفته می‌شود.یافته های پژوهش نشان داد که میانگین دقت مدل بدست آمده برای داده‌های تست، 75 درصد و همچنین امتیاز Roc حاصل شده، برای داده های تست،72 درصد می‌باشد. توجه باینکه این روش در حوزه علوم اسلامی و اصطلاحنامه‌ها برای اولین بار مورد استفاده قرار گرفته است نتایج قابل قبولی است.

نتیجه‌گیری: علی رغم چرخش نظر از اصطلاح نامه‌ها به هستی شناسی‌ها، هنوز هم استفاده از اصطلاح‌نامه‌‌ها مخصوصاً مجموعه هایی نظیر اصطلاحنامه علوم اسلامی مورد توجه است. در مقایسه با پژوهشهای قبلی، روش استفاده شده برای ساخت اصطلاح‌نامه متفاوت بوده و نتایج بدست آمده نیز اطمینان بخش بود.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Automatic Inference of Terminology Relationships in the Persian Islamic Sciences Thesauruses using Graph Convolutional Networks (GCNs)

نویسندگان [English]

  • said abolhasan nezamdost 1
  • ali azimi 2
  • amir Jalali 3
  • Nosratali Ashrafi 4
1 Department of Knowledge and Information Science, kharazmi University, Tehran, Iran.
2 Department of Knowledge and Information Studies, Kharazmi University, Tehran
3 Department of Computer Engineering, Qom University, Qom, Iran
4 Department of Computer Engineering, Kharazmi University, Tehran, Iran
چکیده [English]

Aim: The research seeks to provide a model for automatically inferring the relationships between terms in the Thesaurus of Islamic Sciences using Graph Convolutional Networks.Through new algorithms in the field of deep learning, the study seeked to speed up automatically extracting key terms and their relations in the Thesaurus of Islamic Sciences. Moreover, the study was to increase accuracy and comprehensiveness and reduce costs and at the same time improve relationships between terms.

Methodology: In the current research we used CGN method, which is very prevalent in the field of deep learning. The method can be benefited from the relationship patterns in the graph in addition to pay attention to the characteristics of each node. For this purpose, terms and documents containing their profiles will be converted into semantic vectors by an embedding model, where the proximity of two vectors means the proximity of the concepts of two input texts. These vectors will form the initial values of the graph vertices. At each stage of training, the model will try to predict the presence or absence of an edge between those two nodes by considering two input vectors and also summing up the neighbors of each node. The model is trained through the back propagation method to minimize its cost function. The studied dataset consistted of all terms of the TIS that were produced from 1993 to the beginning of 2021, which were considered as a graph. The terms formed the vertices and the relationship between terms the edges of this graph, and this graph is given as an input to the convolutional network and a model for the automatic inference of connections is obtained. To analyze the obtained outputs, AP and Roc standards have been used.

Findings: Our data is divided into two main parts.The first is the paragraphs that exist in a book and the second is the book indexes of the book. The goal is that the existing artificial intelligence model can learn the relationship between profiles and texts and paragraphs related to the profile and can show us their relationship. A neural network consists of an input layer and an output layer and a number of hidden layers. Through the input layer, the data enters the neural network and the output is produced by the output layer. Between these two layers, there are a number of other layers that increase the complexity of the network and increase the accuracy of the model, which are called hidden layers. The average accuracy of the trained model for the test data was 75% and also the Roc score for the test data was 72%. Since application of the adopted model to extract TIS’s key terms and assigning interrelationships were genuine during the TIS history, the obtained results are acceptable.

Conclusion: Despite the turn of opinion from thesauruses to ontologies, the use of thesauruses is still of interest for some collections including TIS. Compared to previous research, the adopted method to buid the thesaurus was novel and yielded reliable results.

کلیدواژه‌ها [English]

  • Thesaurus Relations
  • Graph Convolutional Networks
  • Islamic Sciences Thesaurus
  • Machine Learning
  • Deep Learning
  • Neural Networks
CAPTCHA Image