Ok, also versuche ich, Informationen von Wikidata über Filme zu bekommen, nimm diesen Film zum Beispiel: Ссылка
Auf der Seite werden die Daten klar in einem lesbaren Format angezeigt. Wenn Sie jedoch versuchen, sie über die API zu extrahieren, erhalten Sie Folgendes: Ссылка
Hier ist ein Abschnitt davon:
%Vor%Das Problem ist, ich bin mir nicht sicher, wie man solche Abschnitte in lesbaren Text umwandeln kann. Ich bekomme die API ruft eine Verbindung zwischen einer Klasse und ihren Eigenschaften mit eindeutigen IDs, aber ich bin immer noch fest.
Ist das zur Zeit möglich oder belle ich den falschen Baum an?
Was Sie suchen sollten, sind die numeric-id
s in jeder Anweisung und fügen Sie eine führende Q
hinzu, um Ihre wikidata-IDs wiederherzustellen, die zu ['Q775450', 'Q3041294', 'Q646968', 'Q434841', 'Q11920']
[ update : Sie können jetzt direkt auf die Q-ID bei mainsnak.datavalue.value.id
zugreifen, anstatt sie aus numeric-id
]
Dies kann mit wikidata-sdk (eine von mir entwickelte JS-Bibliothek) erfolgen simplifyClaims
Funktion
Sobald Sie diese IDs erhalten haben, müssen Sie nur Entitätslabels mit der wbgetentities
API anfordern:
https://www.wikidata.org/w/api.php?action=wbgetentities&ids=Q775450|Q3041294|Q646968|Q434841|Q11920&format=json&props=labels
Mit dem Parameter languages
können Sie sogar nur für einige Sprachen Ergebnisse erzielen: https://www.wikidata.org/w/api.php?action=wbgetentities&ids=Q775450|Q3041294|Q646968|Q434841|Q11920&format=json&props=labels&languages=en|de|fr
Ok, also habe ich keine Lösung gefunden, um das zu verwenden. Das ist das "wbgetentities" -System Ich habe festgestellt, dass Sie den "parse" -Befehl verwenden können, um die HTML-Struktur zu erhalten.
Obwohl es noch etwas Bearbeitung benötigt, ist es viel einfacher als die vorherige Lösung.
Tags und Links json wikidata-api