Die Codebase deines Data Science-Projekts wächst und wächst, und du drohst den Überblick zu verlieren? Dann kann dieses Tool vielleicht Abhilfe schaffen! Felix Plagge hat ein Paket geschrieben, das einen Call Graph für ein beliebiges Python-Skript erstellt. In diesem Artikel erklärt er zunächst, wozu Projektgrafiken nützlich sind und erklärt anschließend die Installation und Verwendung seines Pakets namens project_graph.
STATWORX Cheatsheets – Python Basics Cheatsheet für Data Science
Du willst Python lernen? Oder brauchst du von Zeit zu Zeit eine kleine Gedächtnisstütze beim Programmieren? Genau dafür wurden Cheatsheets erfunden! Unser erstes Cheatsheet mit den Grundlagen von Python ist der Start einer neuen Blog-Serie, in der weitere Cheatsheets in unserem einzigartigen STATWORX Stil folgen werden.
Car Model Classification II: Deployment von TensorFlow-Modellen in Docker mit TensorFlow Serving
Wie interagiert man in einer produktiven Umgebung mit Machine Learning Modellen? Im zweiten Teil unserer 4-teiligen Blogserie zum Thema Car Model Classification lernt ihr, wie ihr ein TensorFlow-Modell zur Bilderkennung mittels TensorFlow Serving bereitstellt und wie Modellabfragen ausgeführt werden können.
Car Model Classification I: Transfer Learning mit ResNet
In dieser 4-teiligen Blogserie zur Klassifizierung von Automodellen möchten wir veranschaulichen, wie ein End-to-end Deep Learning-Projekt umgesetzt werden kann. Im ersten Teil zeigen wir, wie mittels Transfer Learning Fahrzeugbilder klassifiziert werden können. Insbesondere erfahrt ihr, wie ein vortrainiertes ResNet-Modell fine getuned werden kann, um einen Downstream-Task anzugehen.
Finetuning von Tesseract-OCR für deutsche Rechnungen
Ziel dieses Artikels ist es zu zeigen, dass ein Finetuning der Tesseract-OCR auf einer kleinen Menge von Daten bereits eine dramatische Verbesserung der OCR-Leistung bewirken kann
Archive Existing RDS Files
In this blog post, our colleague Lukas gives you a high-level introduction to RDS files (vs. RData files) and serialization. The function checks whether there is already an RDS with the same name in the path, renames it if required, and provides it with a timestamp and a reference ARCHIVED_ON_xx. The function then saves the new RDS under the specified name.
Airflow for Data Scientists
As data scientists, getting our hands on the data we need is often the most challenging part of a project. In practice, we tend to make life hard on ourselves because we don’t use the best tools for the job. Well no longer! Read on to learn how can you can harness Airflow to orchestrate your own ETL processes like a pro!
Making Of: A Free API For COVID-19 Data
For all those, who are struggling with the (kind of weird) Johns Hopkins University COVID-19 case data CSV files, we’ve created a free API that makes it easy to integrate the latest worldwide COVID-19 data into your application.
How To Build A Dashboard In Python – Plotly Dash Step-by-Step Tutorial
This blog is a hands-on experience in Dash, presenting core components, how to display figures with callbacks, supplying you with a working web application to play with, and the resources to build your own. Dash is a powerful tool for Python developers. Developed by the team behind Plotly, Dash is an open-source framework built on top of Flask, Plotly.js, and React.js.
Defining Your Own Shortcut in RStudio
In this blog post, Matthias shows you how to write and structure code even faster and more efficiently. Learn how to define keyboard shortcuts in RStudio with his step-by-step tutorial.