@article { author = {Akhshik, Somaye Sadat and Negahdari, Khadije and Emami, Alireza}, title = {Persian Writing in GANJ: Investigating the Impact of Morphology, Semantics, and Writing Style on Iran's Treasure of Scientific and Technical Information}, journal = {Sciences and Techniques of Information Management}, volume = {8}, number = {1}, pages = {193-220}, year = {2022}, publisher = {University of Qom}, issn = {2476-6658}, eissn = {2476-6534}, doi = {10.22091/stim.2021.6418.1505}, abstract = {Objectives: Persian writing has some difficulties that neglecting can affect information retrieval. This study was conducted to investigate the effect of Persian writing problems on the retrieval of documents on the (GANJ) database based on morphological, semantical, and orthographical aspects.Methods: This research is a practical-purpose study that was conducted in a qualitative manner using content analysis techniques. The used method was a researcher-made checklist. The research population was all the records recorded in the GANJ until the time of the survey. Sampling was done by standard sampling. In the category of conjugational problems, the impact of these problems on the retrieval of documents in the database was examined.Results: In the semantic problem category, the effects of semantic ambiguity or semantic differences on the information retrieval of documents were examined. This case was done in the category of orthography problems to determine difficulties arising from morphological and written features of Persian writing.Conclusions: According to the data obtained from searching for keywords related to each difficulty in the Ganj, it was observed that inconsistencies in the text affect the retrieval result.The results of the present study showed that morphological, semantic, and orthographical problems affect the information retrieval results in the database. It was also found that in the morphological group only for the "adjective morphological morphemes", and in the orthography group, for the problems of "accent mark", "ی and ء transposition in Persian words", "writing of middle and end ء (tittle) with الف seat", "writing of middle and end ء (tittle) with واو seat", "remove or writing tilde Mark" and "writing of consonantal ی after inarticulate ه" have been deliberated and difficulties in the semantic group were completely neglected. Since Ganj is the basis of other Irandoc databases, regardless of morphological, semantic, and calligraphic problems can affect the work of other systems as well. }, keywords = { Persian Writing,information retrieval,Ganj Database,Semantic problems,Writing style,Morphology problems,Iranian Research Institute for Information Science and Technology (IranDoc)}, title_fa = {خط فارسی در گنج: واکاوی تأثیر مسائل صرف، معنا و رسم‌‌الخط بر بازیابی اطلاعات در پایگاه اطلاعات علمی ایران}, abstract_fa = {هدف: خط فارسی دشواری‌‌هایی دارد که بی‌‌توجهی به آنها، بازیابی اطلاعات را تحت تأثیر قرار می‌‌دهد. پژوهش حاضر با هدف بررسی تأثیر مشکلات خط فارسی در ابعاد صرفی، معنایی و رسم‌الخط بر بازیابی مدارک پایگاه گنج انجام شده است.روش‌‌: این پژوهش از نظر هدف کاربردی بوده که به شیوه کیفی و با استفاده از تکنیک تحلیل محتوا انجام شد. ابزار مورد استفاده، سیاهه وارسی محقق ساخته بود. جامعه پژوهش نیز تمامی مدارک ثبت شده در گنج تا زمان اجرای پژوهش می‌‌باشد. نمونه‌‌گیری به صورت نمونه‌‌گیری معیاری انجام شد. با توجه به داده‌‌های به دست آمده، توصیف و تحلیل انجام گرفت.نتایج: در دسته مشکلات صرفی، تأثیر مسائل و دشواری‌‌های مربوط به صرف یا ساخت‌‌واژه در بازیابی مدارک و در دسته مشکلات معنایی تأثیر دشواری‌‌هایی که از نظر معنا در واژه ابهام یا تفاوت معنایی ایجاد می‌‌کنند، بر بازیابی مدارک بررسی شد. در مشکلات رسم‌‌الخط، این بررسی برای دشواری‌‌های ناشی از ویژگی‌‌های ریخت‌‌شناسی و نوشتاری خط فارسی انجام شد.نتیجه‌‌گیری: پژوهش حاضر نشان داد مشکلات صرفی، معنایی و رسم‌‌الخط، نتایج بازیابی اطلاعات در گنج را تحت تأثیر قرار می‌‌دهند. همچنین در این پایگاه در گروه صرفی تنها برای تک‌‌واژ‌‌های صرفی صفت، و در گروه رسم‌‌الخط، برای مشکلات علامت تشدید، جابه‌‌جایی «ی» و همزه در کلمات فارسی، نگارش همزه میانی و پایانی با کرسی «الف»، نگارش همزه میانی و پایانی با کرسی «واو»، «حذف یا نوشتن علامت مد» و «نوشتن صامت «ی» بعد از «ه» غیرملفوظ، چاره‌‌اندیشی شده و در گروه معنایی به هیچ یک از دشواری‌‌ها توجهی نشده است. }, keywords_fa = { مسائل صرفی,مسائل معنایی,رسم‌‌الخط,خط فارسی,بازیابی اطلاعات,پایگاه گنج‌‌,پژوهشگاه علوم و فنا‌‌وری اطلاعات ایران (ایرانداک)}, url = {https://stim.qom.ac.ir/article_2135.html}, eprint = {https://stim.qom.ac.ir/article_2135_51ce2ff198e28ec50c39ed8191f27fa3.pdf} }