Hinweis: Diese Frage kann auf Systemen, die das enthaltene Emoji nicht unterstützen, seltsam aussehen.
Dies ist eine Folgefrage an Wie entferne ich Emoji aus der Zeichenfolge? .
Ich möchte einen regulären Ausdruck erstellen, der allen Emojis entspricht, die in Mac OS X / iOS eingegeben werden können.
Die offensichtlichen Unicode-Blöcke decken die meisten, aber nicht alle dieser Emoji ab:
Wikipedia bietet eine kompilierte Liste von allen Symbolen, die in Apple Color Emoji auf OS X Mountain Lion und iOS 6 verfügbar sind , die wie ein guter Ausgangspunkt aussieht: (leicht aktualisiert)
%Vor%Die meisten Zeichen haben einen einzigen Codepunkt und das Konvertieren dieser Zeichen wäre einfach:
Die kommenden Unicode-Emoji-Dateien würden dabei helfen. Im Moment sind das noch Entwürfe, aber sie könnten dir trotzdem helfen.
Wenn Sie Ссылка analysieren, können Sie ganz leicht eine Liste aller Emojis erhalten der Unicode-Standard. (Beachten Sie, dass einige dieser Emoji aus mehreren Codepunkten bestehen.) Sobald Sie eine solche Liste haben, ist es trivial, sie in einen regulären Ausdruck umzuwandeln.
Hier ist eine JavaScript-Version: Ссылка Und hier ist das Skript, das darauf basiert die Daten von emoji-data.txt
: Ссылка
Dieser Regex entspricht allen 845 Emoji, die aus Emoji-Unicode-Zeichen stammen das Web :
%Vor%Beispiele finden Sie hier: Ссылка
BEARBEITEN: Ich habe die Regex angepasst, um ASCII-Zahlen und -Symbole auszuschließen. Siehe Kommentare von Wie entferne ich Emoji von der Zeichenfolge für Details.