LLM-enabled I-ADOPT Variable Extraction using Semantics

Forscher versehen Daten mit Schlüsselwörtern zur Beschreibung der beobachteten oder modellierten physikalischen Eigenschaften. Um die Auffindbarkeit und Interoperabilität dieser Metadaten zu gewährleisten, sollten die Schlüsselwörter maschinenlesbar sein und standardisierten Vokabularen oder Ontologien entsprechen. Das I-ADOPT-Rahmenwerk bietet Richtlinien für die Formulierung solcher Schlüsselwörter in Übereinstimmung mit den FAIR-Grundsätzen; die Umwandlung häufig verwendeter Begriffe in atomare I-ADOPT-Komponenten ist jedoch nach wie vor eine hochgradig manuelle Aufgabe, die sowohl semantisches als auch fachliches Wissen erfordert. Als Antwort darauf schlagen wir einen LLM-basierten Arbeitsablauf vor, um FAIR-konforme Beschreibungen von Variablen zu erzeugen, die mit dem I-ADOPT-Rahmenwerk übereinstimmen.