Gibt es irgendwelche Möglichkeiten, die freebase Data Dumps zu verwenden, um eine Datenbank zu erstellen, die der von freebase ähnelt, aber auf Ihrem eigenen Server? Ziemlich viel Freebase aber lokal und nicht über die API?
Ich denke, es wäre möglich zu erstellen, aber gibt es dafür bereits bestehende Lösungen? Oder alternative Lösungen für ähnliche Daten ohne Verwendung einer API? Ich habe das für dbpedia auch nicht gefunden: |
Sehen Sie sich das Projekt freebase-quad-rdfize in Google Code an. Es sollte Ihnen ermöglichen, den wöchentlichen Freebase Quad Dump herunterzuladen und in den RDF Triple Store Ihrer Wahl zu laden.
Ich bin der Schöpfer von : BaseKB , der ersten nutzbaren Konvertierung von Freebase nach RDF.
Es gibt Probleme mit der Schlüsselintegrität im Freebase-Quad-Dump, die es schwierig machen, vollständig korrekte Ergebnisse vom Quad-Dump zu erhalten. : BaseKB rekonstruiert die Schlüsselstruktur von Freebase, so dass die eindeutige Namensannahme gilt. Dies ist wichtig, weil die Fähigkeit, einfache SPARQL-Abfragen zu schreiben, die wie SQL-Abfragen funktionieren, davon abhängt.
Momentan,: BaseKB existiert in zwei Editionen. Es gibt eine kostenlose Ausgabe, die aus 120 Millionen Fakten über 4 Millionen Themen besteht (die aus Wikipedia) und es gibt eine "Pro" -Edition, die alles enthält.
Was die von Philip Kendall aufgeworfenen Leistungsprobleme anbelangt, kann ich sagen, dass es hauptsächlich darum geht, genug RAM zu haben. Mit 24 GB RAM kann ich die kostenlose Edition in einer Stunde in ein Triple-Store laden. Einige Abfragen dauern länger als ich möchte, aber die allgemeine Abfrageleistung ist gut.
Wer die "Pro" -Edition verwenden möchte, benötigt eine ungewöhnlich leistungsfähige Hardware und wird viel Mühe darauf verwenden, ihre Toolchain zum Laufen zu bringen. Ich arbeite gerade mit Partnern zusammen, um "Pro" auf zufriedenstellende Weise an die Nutzer zu liefern.
Das Importieren der Daten in einen Triple-Store Ihrer Wahl wäre nicht schwer - aber Sie werden große Schwierigkeiten haben, in angemessener Zeit Antworten zu erhalten, wenn Sie nicht etwas Triviales tun.
Jemand hat den ganzen Datensatz vor ein paar Jahren in MySQL importiert - es hat 2 Wochen gedauert, um zu laden, und selbst einfache Abfragen wie "die Anzahl der als Person getippten Dinge" haben 1 Minute gedauert, um eine Antwort zu geben. Das war auf großer Hardware und der Datensatz ist jetzt viel größer als damals.
Wenn Sie die Datenbank exportieren können, um tabulatorgetrennte oder durch Komma getrennte Werte in TXT- oder Datenbankdateien wie MDB, XLS oder einem anderen stark transportierbaren Datenformat zu verwenden, haben Sie kein Problem damit, eine eigene MySQL-Datenbank zu erstellen Computer mit diesen Daten. Hauptsache ist, dass Sie Daten exportieren können, aus denen Sie Ihre eigene Datenbank erstellen können.