Читать книгу R für Data Science - Hadley Wickham - Страница 20

Hilfe erhalten und mehr lernen

Оглавление

Dieses Buch ist keine Insel, es gibt nicht nur eine einzige Quelle, die es Ihnen erlaubt, R zu beherrschen. Wenn Sie die im Buch beschriebenen Techniken auf Ihre eigenen Daten anwenden, werden schnell Fragen auftauchen, die ich in diesem Buch nicht beantwortet habe. Dieser Abschnitt gibt einige Tipps, wie Sie sich Hilfe holen und wie Sie mehr lernen können.

Falls Sie irgendwo steckenbleiben, beginnen Sie mit Google. Normalerweise genügt es, in einer Suche ein »R« hinzuzufügen, um sie auf relevante Ergebnisse einzuschränken: Wenn die Suche nichts Richtiges gebracht hat, bedeutet das oftmals, dass keine R-spezifischen Ergebnisse verfügbar sind. Google ist insbesondere nützlich für Fehlermeldungen. Wenn Sie eine Fehlermeldung erhalten und diese nicht interpretieren können, sollten Sie diese Meldung per Google suchen! Die Chancen stehen gut, dass jemand in der Vergangenheit über die gleiche Fehlermeldung gestolpert ist und es irgendwo im Web Hilfe gibt. (Wenn die Fehlermeldung nicht in Englisch erscheint, führen Sie Sys.setenv(LANGUAGE = "en") aus und starten den Code noch einmal; die Wahrscheinlichkeit, Hilfe für englische Fehlermeldungen zu finden, ist wesentlich höher.)

Probieren Sie Stackoverflow (http://stackoverflow.com), wenn Ihnen Google nicht helfen konnte. Investieren Sie zunächst etwas Zeit, um nach einer vorhandenen Antwort zu suchen; schließen Sie [R] in Ihre Anfrage ein, um die Suche auf Fragen und Antworten zu beschränken, die mit R zu tun haben. Wenn Sie nichts Brauchbares finden, bereiten Sie ein minimales und reproduzierbares Beispiel oder Reprex vor. Ein gutes Reprex erleichtert es anderen Leuten, Ihnen zu helfen, und oftmals finden Sie die Ursache für das Problem selbst heraus, während Sie das Beispiel formulieren.

Drei Dinge müssen Sie in Ihrem Beispiel angeben, damit es reproduzierbar wird: erforderliche Pakete, Daten und Code:

 Pakete sollten am Anfang des Skripts geladen werden, sodass man leicht sehen kann, welche Pakete für das Beispiel erforderlich sind. Das ist auch ein passender Zeitpunkt, um zu überprüfen, ob man die neueste Version jedes Pakets verwendet; es ist denkbar, dass Sie einen Bug entdeckt haben, der inzwischen beseitigt ist, seit Sie das Paket installiert haben. Für Pakete im Tidyverse lässt sich das ganz einfach mit tidyverse_update() prüfen.

 Um Daten in eine Anfrage einzubinden, ist es am einfachsten, mit dput() den R-Code zu generieren, der sie neu erzeugt. Um zum Beispiel den Datensatz mtcars in R erneut zu erzeugen, führe ich die folgenden Schritte aus:In R dput(mtcars) ausführen.Die Ausgabe kopieren.In meinem reproduzierbaren Skript mtcars <- eintippen und dann einfügen.

Probieren Sie, die kleinste Teilmenge Ihrer Daten zu finden, bei der das Problem immer noch auftritt.

 Investieren Sie etwas Zeit, um sicherzustellen, dass Ihr Code für andere Personen leicht zu lesen ist:–Achten Sie darauf, Leerzeichen zu verwenden und prägnante, aber informative Variablennamen zu vergeben.–Weisen Sie mit Kommentaren auf die Stelle hin, wo Ihr Problem auftritt.–Entfernen Sie möglichst alles, was nichts mit dem Problem zu tun hat.

Je kürzer der Code ist, desto verständlicher ist er und desto einfacher lässt er sich korrigieren.

Vergewissern Sie sich abschließend, dass Sie tatsächlich ein reproduzierbares Beispiel erstellt haben, indem Sie eine neue R-Sitzung starten, das Skript kopieren und in die Sitzung einfügen.

Des Weiteren sollten Sie sich darauf vorbereiten, Probleme zu lösen, bevor sie auftreten. Wenn Sie jeden Tag ein wenig Zeit investieren, um R zu lernen, macht sich das auf lange Sicht bezahlt. So können Sie unter anderem im RStudio-Blog (https://blog.rstudio.org) verfolgen, was Hadley, Garrett und andere Leute bei RStudio tun. Hier finden Sie Ankündigungen zu neuen Paketen, neue IDE-Features und persönliche Schulungen. Außerdem können Sie Hadley (@hadleywickham (https://twitter.com/hadleywickham)) oder Garrett (@statgarrett (https://twitter.com/statgarrett) auf Twitter oder @rstudiotips (https://twitter.com/rstudiotips) folgen, um sich über neue Features in der IDE zu informieren.

Wenn Sie sich umfassend in der R-Community informieren wollen, sollten Sie http://www.r-bloggers.com lesen: Hier werden mehr als 500 Blogs über R aus der ganzen Welt zusammengefasst. Als aktiver Twitter-Benutzer folgen Sie dem Hashtag #rstats. Twitter ist eines der wichtigsten Tools, die Hadley nutzt, um mit neuen Entwicklungen in der Community Schritt zu halten.

R für Data Science

Подняться наверх