optimization

___ qstnhdr ___ Beliebige Dokumentation zur Optimierung der Leistung von R? [Duplikat] ___ answer4984253 ___

Zunächst sollten Sie sich R Inferno von Patric Burns ansehen.

Dann ist es die beste Idee, hier detailliertere Fragen zu stellen.

    
___ tag123r ___ R ist eine freie, quelloffene Programmiersprache und Softwareumgebung für statistische Berechnungen, Bioinformatik, Visualisierung und allgemeine Datenverarbeitung. Stellen Sie minimale, reproduzierbare, repräsentative Beispiele für Ihre Fragen bereit. Verwenden Sie dput () für Daten und geben Sie alle Nicht-Basis-Pakete mit Bibliotheksaufrufen an. Bilder für Daten oder Code nicht einbetten, eingerückte Codeblöcke verwenden. Verwenden Sie für statistische Fragen http://stats.stackexchange.com. ___ answer4987138 ___

eine einfache Google-Suche nach "effiziente Programmierung in r" zeigt die folgenden ausgezeichneten Ressourcen. Die erste Ressource ist großartig, da sie einen Vergleich der schlechten, guten und besten Möglichkeiten zur Programmierung einer Aufgabe in R liefert. Die zweite Ressource ist allgemeiner.

  1. Ссылка
  2. Ссылка

Wenn Sie sich speziellere Bereiche ansehen, um Ihren R-Code zu optimieren, spezifizieren Sie ihn klarer und ich bin sicher, dass Sie hier einen Experten finden werden!

    
___ tag123optimierung ___ Optimierung ist der Akt der Verbesserung einer Methode oder eines Designs. In der Programmierung nimmt die Optimierung normalerweise die Form an, die Geschwindigkeit eines Algorithmus zu erhöhen oder die benötigten Ressourcen zu reduzieren. Eine weitere Bedeutung der Optimierung sind numerische Optimierungsalgorithmen. ___ qstntxt ___

Ich bin ziemlich neu in R, und eine Sache, die mir aufgefallen ist, ist, dass es ziemlich langsam läuft. Gibt es Unterlagen zur Optimierung von R? Zum Beispiel wird die Optimierung von Python sehr gut hier beschrieben. In meinem speziellen Fall bin ich daran interessiert, R für Batch-Jobs zu optimieren.

Ich habe Googling für eine Antwort natürlich probiert, aber es ist nicht gerade einfach für R info, da R ein ziemlich generisches kleines Suchmuster ist.

    
___ answer4983446 ___

"Es läuft ziemlich langsam" ist sehr vage. Es gibt viele Techniken, um R auf die effizienteste Art und Weise zu verwenden, die allgemeine Regel lautet "Schleifen vermeiden und vektorisieren" - aber es gibt so viel mehr, als dass sichergestellt wird, dass Objekte im Voraus zugewiesen und nicht in der Größe verändert werden.

Es hängt wirklich davon ab, was Sie tun, also seien Sie bitte genauer. Die Standard-Dokumentation hat viele Tipps für die Grundlagen und Ihre Frage bietet nicht wirklich die Möglichkeit für jemanden, mehr als nur zu erbrechen.

Wenn Standard R für Ihre Anforderungen wirklich begrenzt ist, können Sie direkt in einer kompilierten Sprache wie C schreiben oder erweiterte Schnittstellen wie Rcpp verwenden. Für andere Werkzeuge und Techniken, die über das grundlegende R-Toolkit hinausgehen, konsultieren Sie die Task-Ansicht "High Performance Computing" auf CRAN.

    
___ answer4984276 ___

Ja, R ist für einen Suchbegriff etwas peinlich, also versuchen Sie RSiteSearch ("Leistung") innerhalb von R - dies wird in vielen R-Dokumenten-Quellen suchen.

    
___
4
Antworten

Wie vermeidet man die Performance-Kosten von Überlauf: versteckt?

Ich habe eine HTML-Tabelle, die mehr als 1K Zeilen und etwa ein Dutzend Spalten enthalten kann. Ich möchte, dass die Spalten eine feste Größe haben (vom Benutzer steuerbar) und weder vertikal noch horizontal wachsen / schrumpfen. Der Inhalt e...
15.05.2012, 22:54
1
Antwort

JVM-Option XX: UseFastEmptyMethods / XX: UseFastAccessorMethods

Bei der Betrachtung von möglichen JVM-Flags zur Optimierung der Startup-Startzeit meines RCP-Produkts fand ich diese ansprechend genannten -XX:UseFastEmptyMethods und -XX:UseFastAccessorMethods . Es scheint, dass diese Flags auf JDK-6...
14.03.2013, 04:45
5
Antworten

Alle Javascript vor Ort funktioniert schrecklich langsam in Firefox 4, wenn transparente PNGs auf der Seite vorhanden sind

ETA UPDATE: Ich habe festgestellt, dass, wenn ich alle transparenten .png-Dateien von meiner Website entferne, sind es etwa 5, es läuft gut. Das ist merkwürdig. Und Up-Stimmen wären sehr hilfreich, ich habe es auf ein paar mehr Computern getest...
18.06.2011, 11:14
1
Antwort

Warum ist diese entfernungsbasierte Abfrage so viel schneller?

Bei der Arbeit hatten wir eine Abfrage zu einer Tabelle mit folgender Struktur: %Vor% Diese Tabelle hatte ca. 6,1 Millionen Zeilen. Um die Details für eine bestimmte IP-Adresse herauszufinden, haben wir eine Abfrage wie die folgende verwe...
24.11.2010, 18:01
1
Antwort

Mixed-Integer Nächste optimale Lösung in Matlab

Ist es möglich, die optimale Lösung für ein gemischt-ganzzahliges Problem zu finden? Zum Beispiel würde ich das vereinfachte Problem unten wünschen: %Vor% gibt x=[0;0;1] zurück, da dies die nächstliegende Ganzzahllösung für den Zielwert v...
23.06.2017, 15:23
3
Antworten

Beschleunigung der Lichtverarbeitung von ca. 50 GB CSV-Datei

Ich habe eine ~ 50GB csv-Datei mit der ich habe Nehmen Sie mehrere Teilmengen der CSV-Spalten Wenden Sie für jede Teilmenge von Spalten der CSV eine andere Formatzeichenfolgenspezifikation an. Geben Sie für jede Teilmenge eine neue CSV m...
25.07.2016, 08:25
3
Antworten

C # Delegieren Compiler-Optimierung

Ich habe angefangen, anonyme Delegierte viel in C # zu verwenden, und ich habe mich gefragt, wie effizient der Compiler oder die Laufzeit sie aus dem Code entfernt, der tatsächlich ausgeführt wird, und ich habe das nirgendwo detaillierter gesehe...
02.06.2010, 14:02
2
Antworten

K-bedeutet: Anfangszentren sind nicht unterscheidbar

Ich verwende das GA-Paket und mein Ziel ist es, die optimale Initiale zu finden Zentroid-Positionen für den K-Means-Clustering-Algorithmus. Meine Daten sind eine spärliche Matrix aus Wörtern im TF-IDF-Score und können hier hier heruntergelade...
15.02.2017, 13:35
1
Antwort

Ist es möglich, Jitter von einem Linux-Rechner zu entfernen, wenn ein einfaches single-threaded C ++ - Programm ausgeführt wird?

Ich mache verschiedene Experimente mit einer Ubuntu-Box, auf der Kernel 3.5.7 läuft. I Aufwärmen mein Benchmark-Code auf 10 Millionen Iterationen und dann mit der Zeit 90 Millionen Iterationen fortfahren. Trotzdem sehe ich folgenden Jitter:...
04.07.2015, 13:21
1
Antwort

c # Parallel vs. Sequential

Ich habe eine große Liste (1.500.000 Artikel), mit jedem Gegenstand muss ich einen sehr kleinen Scheck machen. Totally während 30 Sekunden. Die CPU-Auslastung bei der Verwendung von Sequential beträgt ca. 10%, daher werden viele Ressourcen ni...
04.07.2013, 11:42