Freebase Daten auf dem lokalen Server verwenden?

8

Gibt es irgendwelche Möglichkeiten, die freebase Data Dumps zu verwenden, um eine Datenbank zu erstellen, die der von freebase ähnelt, aber auf Ihrem eigenen Server? Ziemlich viel Freebase aber lokal und nicht über die API?

Ich denke, es wäre möglich zu erstellen, aber gibt es dafür bereits bestehende Lösungen? Oder alternative Lösungen für ähnliche Daten ohne Verwendung einer API? Ich habe das für dbpedia auch nicht gefunden: |

    
freakshow 29.01.2011, 16:23
quelle

5 Antworten

3

Sehen Sie sich das Projekt freebase-quad-rdfize in Google Code an. Es sollte Ihnen ermöglichen, den wöchentlichen Freebase Quad Dump herunterzuladen und in den RDF Triple Store Ihrer Wahl zu laden.

    
Shawn Simister 31.01.2011, 19:49
quelle
7

Eine Alternative zu freebase-quad-rdfize ist hier: Ссылка

Ich benutze den TDB-Speicher von Apache Jena, um die RDF-Daten zu laden, und Fuseki, um die Daten über das SPARQL-Protokoll über HTTP zu liefern.

Siehe auch:

Außerdem haben Sie jetzt eine andere Option: Ссылка

    
castagna 11.03.2012 18:45
quelle
3

Ich bin der Schöpfer von : BaseKB , der ersten nutzbaren Konvertierung von Freebase nach RDF.

Es gibt Probleme mit der Schlüsselintegrität im Freebase-Quad-Dump, die es schwierig machen, vollständig korrekte Ergebnisse vom Quad-Dump zu erhalten. : BaseKB rekonstruiert die Schlüsselstruktur von Freebase, so dass die eindeutige Namensannahme gilt. Dies ist wichtig, weil die Fähigkeit, einfache SPARQL-Abfragen zu schreiben, die wie SQL-Abfragen funktionieren, davon abhängt.

Momentan,: BaseKB existiert in zwei Editionen. Es gibt eine kostenlose Ausgabe, die aus 120 Millionen Fakten über 4 Millionen Themen besteht (die aus Wikipedia) und es gibt eine "Pro" -Edition, die alles enthält.

Was die von Philip Kendall aufgeworfenen Leistungsprobleme anbelangt, kann ich sagen, dass es hauptsächlich darum geht, genug RAM zu haben. Mit 24 GB RAM kann ich die kostenlose Edition in einer Stunde in ein Triple-Store laden. Einige Abfragen dauern länger als ich möchte, aber die allgemeine Abfrageleistung ist gut.

Wer die "Pro" -Edition verwenden möchte, benötigt eine ungewöhnlich leistungsfähige Hardware und wird viel Mühe darauf verwenden, ihre Toolchain zum Laufen zu bringen. Ich arbeite gerade mit Partnern zusammen, um "Pro" auf zufriedenstellende Weise an die Nutzer zu liefern.

    
Paul A Houle 31.05.2012 13:52
quelle
2

Das Importieren der Daten in einen Triple-Store Ihrer Wahl wäre nicht schwer - aber Sie werden große Schwierigkeiten haben, in angemessener Zeit Antworten zu erhalten, wenn Sie nicht etwas Triviales tun.

Jemand hat den ganzen Datensatz vor ein paar Jahren in MySQL importiert - es hat 2 Wochen gedauert, um zu laden, und selbst einfache Abfragen wie "die Anzahl der als Person getippten Dinge" haben 1 Minute gedauert, um eine Antwort zu geben. Das war auf großer Hardware und der Datensatz ist jetzt viel größer als damals.

    
Philip Kendall 29.01.2011 17:47
quelle
1

Wenn Sie die Datenbank exportieren können, um tabulatorgetrennte oder durch Komma getrennte Werte in TXT- oder Datenbankdateien wie MDB, XLS oder einem anderen stark transportierbaren Datenformat zu verwenden, haben Sie kein Problem damit, eine eigene MySQL-Datenbank zu erstellen Computer mit diesen Daten. Hauptsache ist, dass Sie Daten exportieren können, aus denen Sie Ihre eigene Datenbank erstellen können.

    
DoctorLouie 29.01.2011 16:26
quelle

Tags und Links