Ich werde Masterstudenten im Herbst einen Ökonometriekurs anbieten. Ich denke, es ist wichtig für sie, das Programmieren mit Daten als eine wesentliche Fähigkeit der angewandten Forschung zu erlernen. Welche Vorschläge haben Sie für die Programmiersprache? Ich stütze mich hauptsächlich auf R. Was für andere sollte ich beachten?
R ist eine sehr gute Wahl. Mach es.
Die Anzahl der Ressourcen im Web steigt ständig. Ein nettes Set von Dias ist das UCLA Stat Consulting Center .
Und wenn Sie sich für Ökonometrie interessieren, sollten Sie sich Grant Farnworths Ökonometrie mit R auf CRAN; das Applied Econometrics with R Buch von Zeileis und Kleiber ist auch sehr gut.
Python - speziell die Module numpy , pandas und matplotlib , die ipython Notebook als IDE.
Ich werde auf alle anderen Kommentare nicken, die R vorschlagen. Es ist unbestreitbar, dass R eine viel größere Auswahl an Paketen zur Auswahl hat. Aber ich denke, es ist Unsinn zu versuchen, R-Syntax als erste Programmiersprache zu lehren. Anfänger werden es einfach nicht bekommen und sie werden ausgeschaltet. Die R-Syntax ist besonders kontraintuitiv.
Aus meiner eigenen Erfahrung heraus konnte ich mit nur einem kleinen Python-Paket herausfinden, welche Funktionen, Klassen und Objekte es waren und erst danach ergab sich für mich Sinn. Außerdem finde ich, dass das ipython-Notebook unübertroffen ist, wenn es darum geht, die Codierung zu vereinfachen und Ergebnisse zu bewerten. Es hat die Notwendigkeit beseitigt, die Augen vom Quelleneditorfenster zum Shellfenster und zurück zu bewegen, wie es in jeder anderen IDE der Fall wäre.
Ich bin überrascht, dass niemand sonst Excel erwähnt hat. Wie Brian Ripley einmal sagte (siehe Folie 7):
Machen wir uns nichts vor: am meisten weit verbreitete Software für Statistiken sind Excel.
In der Tat ist Excel ein ausgezeichnetes Werkzeug zum Addieren von Zahlenspalten. Wenn Sie jedoch sagen, dass die Analyse, die Sie durchführen, komplizierter ist, sollten Sie unbedingt eine geeignete Programmiersprache verwenden.
Von den drei offensichtlichen Datenbearbeitungssprachen (R, MATLAB und Python) verfügt R über die besten Tools zur Datenmanipulation. Siehe diese andere SO-Frage für einen detaillierteren Vergleich.
BEARBEITEN: Wenn ich das nochmal lese, klingt das eher nach Excel. Ich möchte meine Antwort erweitern, um meinen Ruf zu retten.
Excel verursacht mir viel mehr Probleme als Vorteile. Seine weit verbreitete Verwendung in meiner Organisation ist meist schädlich. Es ist sehr schwer nachvollziehbar, woher die Daten kommen und wie Ihre Berechnungen funktionieren. Das Debuggen von Excel-Modellen ist nahezu unmöglich. Es fördert lokale Datenspeicher statt zentraler Datenbanken. Es funktioniert nicht mit Diff-Tools und es macht die Reproduzierbarkeit Ihrer Wissenschaft schwierig. Von einem semantischen Standpunkt trennt es nicht Daten und was-ist-getan-zu-den-Daten. Die Vorstellung, dass alle Ihre Variablen einen Standort benötigen, lenkt vom Verständnis ab. Die Plotfähigkeiten sind lächerlich schrecklich.
Alles in allem Excel ist nützlich für ein paar spezifische Dinge:
Als CSV-Viewer. Sicher, R hat die Funktion View
, aber es ist nicht so schön.
Wirklich einfache Erkundung von Daten. Sortieren, filtern, Spalten aufaddieren. Ich finde, dass diese mit einer Point-and-Click-Schnittstelle etwas schneller erledigt werden können als mit Code. Natürlich müssen Sie später Code für die Reproduzierbarkeit schreiben, aber in der Anfangsphase ist Excel ziemlich gut dafür.
Die Grafiken sind unverwechselbar und leicht zu erkennen. Wenn Sie sehen, dass jemand eine Präsentation mit einem in Excel gezeichneten Diagramm vorstellt, wissen Sie, dass Sie den Ergebnissen nicht vertrauen können.
Das ist es. Für alles andere ist es ein Chaos.
R Sprache ist die beste Option für das Lernen und Lehren des ökonometrischen Kurses. Gretl ist auch eine andere nützliche GUI-Software.
Tags und Links r