Читать книгу R für Data Science - Hadley Wickham - Страница 56

Übungen

Оглавление

1 Ermitteln Sie alle Flüge, dieeine Ankunftsverspätung von zwei oder mehr Stunden hatten,nach Houston (IAH oder HOU) geflogen sind,von United, American oder Delta durchgeführt wurden,im Sommer (Juli, August und September) abgeflogen sind,mehr als zwei Stunden zu spät angekommen, aber nicht verspätet gestartet sind,mindestens eine Stunde Verspätung hatten, aber mehr als 30 Minuten im Flug aufgeholt haben,zwischen Mitternacht und 6 Uhr (jeweils inklusive) abgeflogen sind.

2 Eine andere nützliche dplyr-Hilfsfunktion zum Filtern ist between(). Was bewirkt sie? Können Sie damit den Code vereinfachen, der für die Lösung der vorherigen Aufgaben erforderlich ist?

3 Bei wie vielen Flügen fehlt die Abflugzeit (dep_time)? Welche anderen Variablen fehlen? Was könnten diese Zeilen darstellen?

4 Warum ist NA ^ 0 kein fehlender Wert? Warum ist NA | TRUE kein fehlender Wert? Warum ist FALSE & NA kein fehlender Wert? Können Sie daraus eine allgemeine Regel ableiten? (NA * 0 ist ein heikles Gegenbeispiel!)

R für Data Science

Подняться наверх