Выявление механизмов недобросовестного повышения наукометрических показателей
Аннотация
Цель исследования состоит в выявлении коллективов авторов, недобросовестно повышающих свои наукометрические показатели путем частого взаимного цитирования. Если составить граф цитирований, где вершинами будут выступать авторы, а ребрами — отношения «автор процитировал автора», то такими подозрительными коллективами могут быть клики, на которые есть мало ссылок от других авторов, а внутренних ссылок, наоборот, много. Были получены метаданные о научных публикациях из сервиса Crossref, проведена их фильтрация и приведение к удобному для обработки виду с последующей загрузкой в локальную базу данных MySQL. После этапа переноса данных были выделены неориентированный граф цитирований и его компоненты связности, найдены максимальные клики и проведён анализ их статистических характеристик. С учетом этих характеристик выделены наиболее подозрительные коллективы. Данный метод может быть использован для поиска групп авторов, цитирующих друг друга по договоренности.
Литература
X. Bai, F. Xia, I. Lee, J. Zhang, and Z. Ning, “Identifying Anomalous Citations for Objective Evaluation of Scholarly Article Impact,” PLOS ONE, vol. 11, no. 9, p. e0162364, 2016; doi:10.1371/journal.pone.0162364
J. Chakraborty, D. Pradhan, H. S. Dutta, S. Nandi, and T. Chakraborty, “On Good and Bad Intentions behind Anomalous Citation Patterns among Journals in Computer Sciences,” in arXiv, 2018; doi:10.48550/ARXIV.1807.10804
T. Yu, G. Yu, Y. Song and M.-Y. Wang, “Toward the more effective identification of journals with anomalous self-citation,” Malaysian Journal of Library & Information Science, vol. 23, no. 2, pp. 25–46, 2018; doi:10.22452/mjlis.vol23no2.2
S. Kojaku, G. Livan, and N. Masuda, “Detecting anomalous citation groups in journal networks,” Scientific Reports, vol. 11, p. 14524, 2021; doi:10.1038/s41598-021-93572-3
J. Liu, F. Xia, X. Feng, J. Ren, and H. Liu, “Deep Graph Learning for Anomalous Citation Detection,” IEEE Transactions on Neural Networks and Learning Systems, vol. 33, no. 6, pp. 2543–2557, 2022; doi:10.1109/tnnls.2022.3145092
J. Kemp, “Free public data file of 112+ million Crossref records,” in Crossref.org, 2020. [Online]. Available: https://www.crossref.org/blog/free-public-data-file-of-112-million-crossref-records/28
C. Bron and J. Kerbosch, “Algorithm 457: finding all cliques of an undirected graph,” Communications of the ACM, vol. 16, no. 9, pp. 575–577, 1973; doi:10.1145/362342.362367
ORCID Inc., “About ORCID,” in orcid.org, 2023. [Online]. Available: https://info.orcid.org/
Digital Science & Research Solutions Inc., “The data in Dimensions – from idea to impact,” in dimensions.ai, 2023. [Online]. Available: https://www.dimensions.ai/dimensions-data/
D. Emelyanov, “Cliques In Science,” in github.com, 2022. [Online]. Available: https://github.com/Deimos-Apollon/Cliques_In_Science
Материал публикуется под лицензией: