Wissenschaftler der Uni Wuppertal entwickeln Funktionserweiterung für Wikipedia

Im Rahmen eines von der Deutschen Forschungsgemeinschaft (DFG) geförderten Projekts haben Wissenschaftler des Lehrstuhls für Data & Knowledge Engineering an der Bergischen Universität Wuppertal eine neue Funktion für die freie OnlineEnzyklopädie Wikipedia entwickelt

Seit Anfang Januar besteht die Möglichkeit, mathematische Formeln um die Bedeutung ihrer einzelnen Elemente zu erweitern. Die Erweiterung basiert auf der Erforschung effektiver Methoden zur automatischen Aufbereitung mathematischer Ausdrücke als maschinenlesbare Informationen. „Bei vielen Wikipedia-Artikeln fehlt eine gute Erklärung dafür, was die einzelnen Bestandteile der Formeln bedeuten. Das wiederum löst einigen Unmut bei Leser*innen aus“, erklärt Moritz Schubotz. Der Wissenschaftliche Mitarbeiter am Lehrstuhl für Data & Knowledge Engineering von Prof. Dr. Bela Gipp hat die neue Funktion gemeinsam mit Lehrstuhlkollege André Greiner-Petter entwickelt.

Aktuelle Stellenangebote:

Ein Beispiel aus der Praxis findet sich auf der Wikipedia-Seite zur Masse-EnergieÄquivalenz – dem berühmten, von Albert Einstein entdeckten Naturgesetz – beschrieben durch die Formel „E=mc2 “: Diese enthält neuerdings Informationen zu den Variablen „E“, „m“ und „c“. „Durch Klicken auf die Formel wird eine neue Informationsseite geöffnet, auf der die Bedeutungen der einzelnen Elemente sowie Links zur weiteren Beschreibung der Formel angezeigt werden“, so Schubotz. Dort erfahren die Leser*innen u.a., dass „E“ für Energie steht, und eine physikalische Größe darstellt. „Die Nutzer*innen müssen somit nicht mehr den kompletten Artikel lesen und sich in dem Fachgebiet des Artikels auskennen, um die Formel als solche zu verstehen.“ Die Wissenschaftler leisten damit einen wichtigen Beitrag für die Verarbeitung mathematischer Ausdrücke und setzen dafür auch auf Künstliche Intelligenz. „Eine entsprechende Informationsseite, wie beispielsweise die zur Äquivalenz von Masse und Energie, manuell zu erstellen, wäre sehr viel Arbeit.

Daher erforschen wir Methoden, wie diese Informationen automatisch extrahiert werden können“, fasst Schubotz zusammen. Wichtige Daten zu den unterschiedlichsten Formeln stammen dabei aus der sogenannten „Wikidata“, einer zentralen, sprachunabhängigen Wikipedia-Datenbank, die von Menschen sowie von Computerprogrammen bearbeitet werden kann. MEDIEN-INFORMATION Verantwortlich: Dr. Maren Wagner, Pressereferentin Pressestelle Gaußstraße 20, 42119 Wuppertal, Raum B.07.01-03 Telefon 0202/439-3047, -2405 presse@uni-wuppertal.de www.presse.uni-wuppertal.de 24. Januar 2020 „Während die schlagwort-basierte Suche nach relevanten und verwandten Publikationen in vielen wissenschaftlichen Bereichen zu guten Ergebnissen führt, bedarf es in der Mathematik und in den Naturwissenschaften aufgrund der hohen Dichte an mathematischen Ausdrücken zusätzlicher Strategien“, merkt Schubotz an. Einen ersten Schritt stelle dabei die Aufbereitung der mathematischen Ausdrücke dar: „Diese sind in der Regel für die Darstellung optimiert und als Bilder oder in speziellen Formaten abgespeichert.

Für Suchmaschinen zum Beispiel sind das schwer auffindbare Inhalte. Erst durch eine semantische Anreicherung, also das Hinzufügen von Bedeutungen, werden die Formeln zu maschinenlesbaren Informationen.“ Derartige neue Methoden sind eine Grundlage für die automatische Erkennung ähnlicher sowie verwandter mathematischer Ausdrücke. Sie helfen beispielsweise dabei, Such- und Empfehlungsdienste für wissenschaftliche Publikationen zu verbessern und ermöglichen Verlinkungen zu ähnlichen Artikeln und Informationsquellen. Schubotz: „Davon profitieren nicht zuletzt Schüler*innen sowie Studierende in naturwissenschaftlichen Fächern, die sich mathematisches Wissen mit verschiedenen digitalen Medien aneignen.“

http://dke.uni-wuppertal.de Kontakt:

http://purl.org/mir

Quelle: Uni Wuppertal

Anmelden

Aktuelle Stellenangebote:

Kommentare

Neuen Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert