Ich bin daran interessiert, einige reale, massive Datensätze zu finden (& gt; = 1M), die topologisch sortiert werden mussten. Vielleicht etwas in Bezug auf Bioinformatik?
Haben Sie sich die Stanford Large Network Dataset Collection angesehen? Es gibt viele reale Datensätze, große auch, viele von ihnen gerichtet.
Es gibt 650k commits in der Linux-Git-Geschichte; Eine topologische Sortierung der einzelnen Commits hätte den plausiblen Zweck, die Zweige (fusioniert oder nicht) wiederzuentdecken.
Sie können dies um eine Million Objekte erweitern, indem Sie die anderen Git-Objekttypen (Tags, Bäume und Blobs) einbeziehen: dann würde die topologische Sortierung die Verzeichnishierarchien sowie den Commit-Verlauf rekonstruieren.
Tags und Links bioinformatics directed-acyclic-graphs topological-sort