About Risks and Side-Effects… Consult your Purrr-Macist

David Schlepps Blog, Data Science, Statistik

Capture errors, warnings and messages, but keep your list operations going In a recent post about text mining, I discussed some solutions to webscraping the contents of our STATWORX blog using the purrr-package. However, while preparing the next the episode of my series on text mining, I remembered a little gimmick that I found quite helpful along the way. Thus, …

Testing von R Paketen

Markus Berroth Blog

Der letzte Blogbeitrag zeigte warum Testing sinnvoll ist und wie sich der Workflow für einzelne Skripte mit dem testthat-Package gestalltet. Dieser Beitrag soll sich um die Integration von Unit-Testing für eigene Pakete drehen. Set-Up Der einfachste Weg, um Unit-Testing mit dem testthat-Package einzurichten ist devtools::use_testthat() laufen zu lassen. Dies bewirkt mehrere Dinge: Es erzeugt das Verzeichnis tests/testthat. Es fügt testthat …

Unit Testing mit R

Markus Berroth Blog

„All code is guilty until proven innocent.“ Testing ist ein wichtiger Teil in der Entwicklung von stabilem R Code. Testing stellt sicher, dass der Code wie beabsichtigt funktioniert. Allerdings ist dies ein zusätzlicher Schritt im bisherigen Workflow. Oft besteht der übliche "Testing"-Workflow in R darin, nach dem Schreiben einer neuen Funktion, diese zuerst informell in der Konsole zu testen und …

Fehlerbehandlung in R – Handhabung von Ausnahmen mit trycatch

Markus Berroth Blog, Data Science, Statistik

Der vorherige Teil der Reihe drehte sich um die Handhabung von unerwarteten Fehlern und Bugs. Doch manchmal erwartet man das Auftreten von Fehlern, beispielsweiße falls man das gleiche Modell für mehrere Datensätze anwenden möchte. Dabei kann unter anderem der Fehler auftreten, dass das Modell aufgrund von fehlender Varianz nicht geschätzt werden kann. In diesem Fall möchte man nicht, dass durch …

Sparse Matrizen – wann sollte man sie nutzen?

Jakob Gepp Blog, Data Science, Statistik

Wenn man mit Matrizen arbeitet, die viele Nullen enthalten, dann sind schwachbesetzte (engl. sparse) Matrizen das richtige. Hierbei wird der benötigte Speicherplatz der Matrix reduziert, in dem der Inhalt der Matrix effizienter verwaltet wird. Es gibt verschiedene Methoden Matrizen zu komprimieren – zum Beispiel in dem nur die Tupel aus Zeile, Spalte und Wert genutzt werden. Die Matrix reduziert sich …

Fehlerbehandlung in R – Debugging mit RStudio Teil 2

Markus Berroth Blog, Data Science, Statistik

Nachdem der erste Teil die unterschiedlichen Aktivierungsmöglichkeiten für den Debugger behandelt hat, dreht sich der zweite Teil um effizientes Debugging. „Debugging is like being the detective in a crime movie where you are also the murderer.”(1) … und manchmal erinnert man sich nicht mal die Tat begangen zu haben. Im Folgenden werden wir die Debugging-Features von RStudio an einem einfachen …