Ich versuche die Entwicklung der 100 größten Repositories auf GitHub zu verstehen. Ich kann mit der GitHub-Suchfunktion oder GithubArchive.org ab sofort auf die 100 größten Repositories zugreifen (gemessen an der Gesamtzahl der Mitwirkenden, Sterne, Gabeln oder LOC).
Ich möchte jedoch auf die 100 größten Repositorys bei einer gegebenen Daten in der Geschichte (sagen 1. April 2011), so dass ich von diesem Zeitpunkt an ihr Wachstum (oder Rückgang) verfolgen kann. Wie kann ich die 100 größten Repositories auf GitHub (gemessen pro Sternen, Gabeln oder LOC) für ein Datum in der Vergangenheit identifizieren?
Ich denke, das GitHub-Archivprojekt kann hilfreich sein: Ссылка
Er speichert alle öffentlichen Ereignisse aus der GitHub-Timeline und macht sie für die Verarbeitung verfügbar. Die Ereignisse enthalten Informationen über die Repositorys. Daher sollten Sie die Daten dort herausziehen können, um sie an Ihren Anwendungsfall anzupassen.
Zum Beispiel habe ich gerade die folgende Abfrage in der BigQuery-Konsole ( Ссылка ) gefunden, um sie zu finden out die Anzahl der Gabeln des Joyent / Node-Repository für das Datum 2012-03-15:
%Vor%Hier sind die Ergebnisse:
%Vor%Im Ernstfall würden Sie die BigQuery-API verwenden, um etwas Ähnliches zu tun (extrahieren Sie die gewünschten Daten, holen Sie Daten für eine Reihe von Daten usw.).
Und hier ist eine Abfrage zum Abrufen des größten Einzelrepositorys (nach Gabeln) für ein bestimmtes Datum:
%Vor%Ergebnis:
%Vor%Und hier ist die Abfrage, um die Top 100 Repositories nach Gabeln für ein bestimmtes Datum zu holen:
%Vor%Ergebnis:
%Vor%Tags und Links git github open-source