Читать книгу Deep Learning illustriert - Jon Krohn - Страница 51
4.1.5Deep Learning
ОглавлениеVon allen Begriffen in Abbildung 4–1 lässt sich Deep Learning am einfachsten definieren, weil es so präzise abzugrenzen ist. Wir haben in diesem Buch bereits einige Male erwähnt, dass ein Netzwerk, das aus wenigstens einigen Schichten künstlicher Neuronen besteht, als Deep-Learning-Netz bezeichnet werden kann. Wie an den klassischen Architekturen in den Abbildung 1–11 und 1–17 beispielhaft gezeigt wurde, in Abbildung 4–2 im Diagramm dargestellt wird und in Kapitel 7 dann vollständig ausgeführt wird, besitzen Deep-Learning-Netzwerke insgesamt fünf oder mehr Schichten mit der folgenden Struktur:
eine einzelne Eingabeschicht (Input Layer), die für die Daten reserviert ist, die in das Netzwerk eingegeben werden
drei oder mehr verborgene Schichten (Hidden Layers), die aus den Eingabedaten die Repräsentationen lernen. Ein allgemeiner und häufig verwendeter Typ von verborgener Schicht ist der vollständig verbundene Typ, bei dem alle Neuronen einer bestimmten Schicht Informationen von jedem der Neuronen aus der vorhergehenden Schicht empfangen können (vollständig verbundene Schichten werden auch als Dense Layers bezeichnet). Neben diesem vielseitigen Schichttyp gibt es eine Fülle weiterer Typen für spezielle Anwendungsfälle; wir werden die beliebtesten davon im Laufe dieses Abschnittes erwähnen.
eine einzelne Ausgabeschicht (Output Layer), die für die Werte (z.B. Vorhersagen) reserviert ist, die das Netzwerk liefert
Abb. 4–2 Verallgemeinerte Darstellung der Architekturen des Deep-Learning-Modells
Da jede nachfolgende Schicht im Netzwerk in der Lage ist, zunehmend abstraktere, nichtlineare Neukombinationen der vorhergehenden Schichten darzustellen, reichen oft weniger als ein Dutzend Schichten künstlicher Neuronen aus, damit Deep-Learning-Modelle die Repräsentationen lernen, die zum Lösen eines Problems mit einem vorgegebenen Datensatz nötig sind. Gelegentlich wurden aber auch schon Deep-Learning-Netzwerke mit Hunderten oder gar eintausend Schichten erfolgreich demonstriert.3
Wie zunehmend besser werdende Genauigkeits-Benchmarks und zahllose Wettbewerbsgewinne seit dem Sieg von AlexNet beim ILSVRC im Jahre 2012 (Abbildung 1–16) demonstriert haben, ist der Deep-Learning-Ansatz zur Modellierung bei einem breiten Spektrum an Machine-Learning-Aufgaben herausragend. Angesichts der Tatsache, dass Deep Learning einen Großteil der Fortschritte auf dem Gebiet der KI ausmacht, verwundert es nicht, dass die Begriffe »Deep Learning« und »Künstliche Intelligenz« in der Presse immer häufiger synonym verwendet werden.
Begeben wir uns in den Deep-Learning-Ring von Abbildung 4–1, um Aufgabenklassen zu untersuchen, für die Deep-Learning-Algorithmen zum Einsatz kommen: für maschinelles Sehen, für die Verarbeitung natürlicher Sprache und für das Reinforcement Learning.