Ich kompiliere einen Korpus von Tweets für die Sentimentanalyse und versuche Tweets mit Apple Emoji-Zeichen zu sammeln.
Ich habe das Unicode-Zeichen für eines der Gesichter gefunden als: U + 1F604 (U + D83D U + DE04), UTF-8: F0 9F 98 84
Bisher konnte ich keine aussagekräftigen Ergebnisse erzielen. Wenn ich \ud83d\ude04
suche, bekomme ich einige Tweets zurück, aber nichts nützliches. \U0001f604
gibt bei der Suche nichts zurück.
Gibt es eine Möglichkeit für mich, Twitter nach diesen Charakteren zu fragen?
Ich verwende den python-twitter-Wrapper für die API, wäre aber bereit, etwas anderes zu verwenden, wenn eine bessere Alternative existiert.
Wie @Terence Eden darauf hinweist, twittert REST search api nicht mit Emoji-Zeichen, aber die Streaming-API funktioniert (Stand Januar 2016).
Es gibt ein paar Tools für den Zugriff auf twitter-APIs in Python. Den einen, den ich meistens benutzt habe tweepy
. Es kann mit pip
installiert werden.
Die Tweepy-Dokumentation zum Einrichten der Streaming-API ist ziemlich einfach zu befolgen. Die Zeichenfolgen, auf die Sie filtern, müssen die tatsächlichen Emoji-Zeichen enthalten (z. B. "
Das ist möglich - aber es ist ein bisschen knifflig ....
Sie können die Standard-Twitter-Suche nicht verwenden - Sie können jedoch die Streaming-Suche verwenden.
Es gibt Open-Source-Bibliotheken, die unter Ссылка in Ruby und Node verfügbar sind.
Tags und Links twitter