Bekommt lesbare Ergebnisse von Wikidata

7

Ok, also versuche ich, Informationen von Wikidata über Filme zu bekommen, nimm diesen Film zum Beispiel: Ссылка

Auf der Seite werden die Daten klar in einem lesbaren Format angezeigt. Wenn Sie jedoch versuchen, sie über die API zu extrahieren, erhalten Sie Folgendes: Ссылка

Hier ist ein Abschnitt davon:

%Vor%

Das Problem ist, ich bin mir nicht sicher, wie man solche Abschnitte in lesbaren Text umwandeln kann. Ich bekomme die API ruft eine Verbindung zwischen einer Klasse und ihren Eigenschaften mit eindeutigen IDs, aber ich bin immer noch fest.

Ist das zur Zeit möglich oder belle ich den falschen Baum an?

    
Oliver at ontoit 07.07.2015, 10:44
quelle

2 Antworten

14

Was Sie suchen sollten, sind die numeric-id s in jeder Anweisung und fügen Sie eine führende Q hinzu, um Ihre wikidata-IDs wiederherzustellen, die zu ['Q775450', 'Q3041294', 'Q646968', 'Q434841', 'Q11920']

führen sollten

[ update : Sie können jetzt direkt auf die Q-ID bei mainsnak.datavalue.value.id zugreifen, anstatt sie aus numeric-id ]

erstellen zu müssen

Dies kann mit wikidata-sdk (eine von mir entwickelte JS-Bibliothek) erfolgen simplifyClaims Funktion

Sobald Sie diese IDs erhalten haben, müssen Sie nur Entitätslabels mit der wbgetentities API anfordern: https://www.wikidata.org/w/api.php?action=wbgetentities&ids=Q775450|Q3041294|Q646968|Q434841|Q11920&format=json&props=labels

Mit dem Parameter languages können Sie sogar nur für einige Sprachen Ergebnisse erzielen: https://www.wikidata.org/w/api.php?action=wbgetentities&ids=Q775450|Q3041294|Q646968|Q434841|Q11920&format=json&props=labels&languages=en|de|fr

    
maxlath 08.07.2015, 11:05
quelle
0

Ok, also habe ich keine Lösung gefunden, um das zu verwenden. Das ist das "wbgetentities" -System Ich habe festgestellt, dass Sie den "parse" -Befehl verwenden können, um die HTML-Struktur zu erhalten.

Ссылка

Obwohl es noch etwas Bearbeitung benötigt, ist es viel einfacher als die vorherige Lösung.

    
Oliver at ontoit 08.07.2015 11:12
quelle

Tags und Links