Tariq Yousef/ Daniel Kinitz : Similarity-Based Clustering of Pre-Modern Arabic Names

Introduction: Data repositories must manage the identity of their entities. In the case of intellectual history, the challenge lies in premodern, and therefore non-standardised entity names. Our use case deals with Arabic persons related manuscripts (scholars, scribes, etc.). Thus, multiple occurrences of the same person with different spellings and name compositions must be identified and disambiguated. This paper presents a graph clustering approach that combines literal and numerical properties (name and year of event) with promising results. The particular challenge lies in the vast variability of name variants and sometimes unspecific dates.

Tariq Yousef/ Daniel Kinitz (2023): Similarity-Based Clustering of Pre-Modern Arabic Names
in: Baillot, A. / Scholger, W. / Tasovac, T. / Vogeler, G. / Raunig, E. / Scholger, M. / Steiner, E. (eds.). Digital Humanities 2023: Book of Abstracts. Graz 2023. DOI: 10.5281, https://zenodo.org/record/7961822, pp.194-195.

Akademienprogramm Gesamt

Übersicht über alle laufenden Forschungsprojekte im Akademienprogramm:
www.akademienunion.de

Zum AGATE-Portal, Forschungsinformationssystem der Wissenschaftsakademien:
https://agate.academy/

Termine
Vortrag: Kurfürst Friedrich der Weise als Oberhaupt des Hauses Sachsen um 1500 29.01.2024 19:00 - 20:00 — Sächsische Akademie der Wissenschaften zu Leipzig, Karl-Tauchnitz-Straße 1, 04107 Leipzig
Texttransfer und intertextuelle Bezüge in den Inschriften des Mittelalters und der Frühen Neuzeit 07.10.2024 - 09.10.2024 — Sächsische Akademie der Wissenschaften zu Leipzig, Karl-Tauchnitz-Straße 1, 04107 Leipzig
Denkströme

Denkströme IconDas Open Access (Online-)Journal der Sächsischen Akademie der Wissenschaften:

www.denkstroeme.de

Diffusion Fundamentals

Diffusion Fundamentals IconInterdisziplinäres Online Journal für Diffusionstheorie in Kooperation mit der Universität Leipzig:
diffusion.uni-leipzig.de