taz.de -- Neue Datenplattform für Wikipedia: Fakten sollen zentralisiert werden
Die Online-Enzyklopädie Wikipedia startet ein neues Großprojekt: Basis-Fakten wie Geburtstage oder Einwohnerzahlen sollen in einer zentralen Datenbank gebündelt werden.
Mit einem neuen Projekt will der Wikipedia-Betreiber Wikimedia seinen ehrenamtlichen Autoren die Arbeit erleichtern: Unter dem Namen [1][WikiData] wird eine neue Daten-Ressource entstehen, die die Arbeit in der Wikipedia einfacher machen soll.
Statt Basis-Fakten in jeder einzelnen Sprachversion eines Artikels manuell einzutragen, werden sie künftig in einer zentralen Datanbank gepflegt - und automatisch in mehr als 250 Sprechen übersetzt.
Die Realisierung von WikiData ist ein Großprojekt für die Wikimedia Foundation. Denn das Grundprinzip des Artikelschreibens hat sich in den vergangenen zehn Jahren wenig geändert. "WikiData geistert bereits seit Jahren als Idee durch die Wikipedia", erklärt Wikimedia Deutschland-Geschäftsführer Pavel Richter gegenüber taz.de.
Doch nun will er Nägel mit Köpfen machen: Der deutsche Verein [2][sucht elf neue Angestellte], die in den kommenden 12 bis 18 Monaten das Projekt realisieren sollen, darunter sechs Programmierer. Alleine im kommenden Jahr sollen 870.000 Euro in das Projekt gesteckt werden.
Wikimedia Deutschland arbeitet eng mit der US-Stiftung zusammen, ist aber ein eigenständiger Verein. "Die Prioritäten der Wikimedia Foundation sind die Entwicklung eines neuen Artikel-Editors, die Verfügbarmachung von Inhalten auf mobilen Endgeräten sowie der Aufbau eines neuen Datenzentrums", erklärt Richter. "Deshalb haben wir uns entschlossen, dieses Projekt federführend voranzutreiben."
Softwareentwicklung für Wikipedia ist komplex. Die Software der Plattform leistet zwar für den aktuellen Zustand der Enzyklopädie gute Dienste, tief greifende Veränderungen verlangen aber einen enormen Aufwand. So hatte die Wikimedia Foundation schon vor über fünf Jahren Arbeiten für einen neuen Artikel-Editor begonnen, der die Arbeit für Autoren einfacher machen soll - das erste Ergebnis soll erst Ende diesen Jahres vorliegen.
Macht die Community mit?
Doch es gibt nicht nur technische Probleme - auch die Community muss mitziehen. So sind bisher maschinelle Übersetzungen unter Wikipedianern verpönt. Statt einfach die mit 3,5 Millionen englischen Artikeln größte Wikipedia-Ausgabe in möglichst viele Sprachen zu übersetzen, setzt das Wiki-Prinzip darauf, dass sich Muttersprachler das Wissen selbst erarbeiten, das sie in die Enzyklopädie schreiben.
Aus der WikiData-Datenbank können aber keine kompletten Artikel geschöpft werden. Denn die Ontologie, sozusagen das Vokabular der Datenbank, kann nicht so vielfältig wie die menschliche Sprache sein und ist auf eindeutige Sachverhalte begrenzt. Die Einwohnerzahl von Berlin beispielsweise kann einfach aus einer Datenbank gelesen werden.
Welche Bedeutung die preußischen Könige für die Geschichte Berlins hatten, ist jedoch in Datenbanken kaum zu erschließen. Zunächst sollen die Informationen aus WikiData deshalb zunächst separat in Infokästen eingeblendet werden. Wie weit sich die automatischen Informationen in die Artikel integrieren lassen, muss im kommenden Jahr geklärt werden.
Auch wie die zentrale Ressource verwaltet wird, ist zudem eine kritische Frage. So gibt es mit [3][Wikimedia Commons] bereits eine zentrale Ressource für Bilder, Tondateien und Videos, die in allen Wikipedia-Ausgaben verwendet werden können. Doch während das Projekt in den ersten Jahren ohne Probleme lief, gibt es in letzter Zeit heftigen Streit um die Ausrichtung des Wissens-Sammelbeckens.
Weil sich in Wikimedia Commons allzu viele sexuelle oder auf andere Weise kontroverse Inhalte angesammelt hatten, plant die Wikimedia Foundation eine Art Jugendschutz-Filter. Nachdem gerade europäische Wikipedianer jedoch [4][sich strikt gegen die Pläne] aussprachen, wurden die Filterpläne erst einmal auf Eis gelegt.
28 Oct 2011
LINKS
AUTOREN
ARTIKEL ZUM THEMA
Die Wikimedia-Stiftung hat auch dieses Jahr wieder Millionen gesammelt - 72 Prozent mehr als im Vorjahr. Jetzt geht das Hickhack darüber los, wer sie ausgeben darf.
Wikipedia hat 20 Millionen US-Dollar an Spenden eingenommen- so viel wie noch nie. Damit sollen zusätzliche Server bezahlt werden. In Deutschland geht die Spendenaktion weiter.
Die italienische Wikipedia kann einen Erfolg verbuchen. Die "Blog-Killer" Passage in einem geplanten Abhörgesetz wurde nach ihrem Streik vorerst entfernt. Doch die Aktion ist umstritten.
Italiens Regierung will jeder Person erlauben, Richtigstellungen im Internet durchzusetzen. Egal wie richtig sie sind. Machen die Seitenbetreiber nicht mit, drohen deftige Strafen.
Mit einer Abstimmung unter Wikipedia-Autoren will die Wikimedia Foundation Unterstützung für einen Filter gegen "kontroverse Inhalte" finden.