Java-Lambdas Einführung
Der Begriff "Lambda-Ausdruck" entstammt dem Lambda-Kalkül mit dem sich Alonzo Church in den 1930er Jahren anschickte eine formale Spezifikation der Mathematik zu schaffen. Dabei hat er ein Konzept entwickelt, auf dem die funktionalen Programmiersprachen wie LISP, Haskell, Clojure oder Scala aufsetzen und das sich fundamental vom Modell der Turing-Maschine unterscheidet, das den imperativen Sprachen wie Java oder C zugrunde liegt. Der Name leitet sich vom griechischen Buchstaben λ ab den Church für seine Notation verwendete. Weil das kürzer ist -- und cooler aussieht -- steht im Folgenden λ für "Lambda".
Im nachfolgenden Artikel wird gezeigt, was λ-Ausdrücke in Java sind und wie man sie anwenden kann. Es wird hier nur ein Überblick gegeben, die Verwendungsmöglichkeiten von λ-Ausdrücken sind immens vielseitig. Was also ist ein λ oder besser gesagt ein λ-Ausdruck?
Ein Lambda-Ausdruck definiert eine einzelne Funktion deren Typ bestimmt ist durch die Typen ihrer Parameter-Liste und ihres Ergebnis-Typs.
Das klingt abstrakt und sehr akademisch. Aber behalten wir diese Aussage im Hinterkopf, wenn wir im Folgenden an einem Beispiel die Verwendung von λ-Ausdrücken in Java erkunden.
Es sei nicht verschwiegen, daß in obiger Definition ein Detail weggelassen wurde. Für den Typ des λ-Ausdruck
ist in Java auch die throws
-Klausel der Methode von Bedeutung. Was das bedeutet wird später erläutert.
Ein Beispiel mit konventionellen Java-Mitteln
Wir haben hier eine Methode, die die Zahlen einer Liste durchgeht und die Summe der Zahlen als Ergebnis liefert.
public Integer verarbeite(List<Integer> liste) { Integer result = 0; for (Integer x : liste) { result += x; } return result; }
Den Rahmen dieser Methode könnte man benutzen um andere Berechnungen anzustellen. Etwa zu zählen wieviele gerade Zahlen die Liste enthält. Aber jedemal, wenn eine neue Funktion zur Berechnung verwendet werden soll, muß die Methode kopiert und angepaßt werden – das ist nicht schön. Zunähst einmal muß die Methode so erweitert werden, daß auf die Zahlen eine beliebige Funktion angewandt werden kann. Das geschieht in Java immer auf die gleiche Art und Weise, nämlich mit Hilfe einer Klasse oder eines Interface. Wir definieren also ein Interface das eine Funktion zur Berechnung enthält:
interface Function { Integer apply(Integer x); }
Nun erweitert man die Methode so, daß sie eine Instanz dieses Interfaces als Argument übernimmt und
anstelle des fest verdrahteten Ausdrucks x
für die Verechnung verwndet:
public Integer verarbeite(List<Integer> liste, Function fkt) { Integer result = 0; for (Integer x : liste) { result += fkt.apply(x); } return result; }
Um die Methode verarbeite()
verwenden zu können benötigen wir nun ein Objekt, das das Interface Function
implementiert.
Nur mit einem solchen Objekt kann die Methode verwendet werden. Um die Summe der Quadrate zu berechnen definieren wir nun eine Klasse
die das Interface in der geeigneten Weise implementiert:
class Square implements Function { public Integer apply(Integer x) { return x * x; } }
Die Verwendung sieht dann vielleicht so aus:
Integer quadrate = verarbeite(meineListe, new Square());
Das funktioniert natürlich nur dann, wenn wir die Klasse mit der Berechnung frei implementieren und den Namen der Funktion entsprechend dem Interface benennen können. Bei einer existierenden Klasse -- vor allem wenn sie final ist, geht das nicht. Möchten wir zum Beispiel folgende Klasse verwenden:
final class Calc { public Integer doppel(Integer x) { return 2 * x; } }
benötigen wir zusätzlich einen Wrapper oder Adapter der die Methode doppel
auf die Methode apply
des Interface Function
abbildet. Anstelle einer eigenen Klasse kann man beim Aufruf von bearbeite
ein Objekt einer anonymen Klasse instantiieren:
verarbeite(meineListe, new Funktion() { public Integer apply(Integer x) { return new Calc().doppel(x); } });
Und das ist so unübersichtlich wie aufwendig.
Was da stört
Die parameterisierte Methode verarbeite
ist -- so wie sie ist -- eine gute Lösung.
Da brauchen wir nichts zu ändern, entscheidend ist dabei, daß ein Interface mit einer einzigen Methode verwendet wird.
Wirklich unelegant ist der Aufruf der Methode. Keine der Lösungen ist befriedigend und hat Nachteile. Klassen die direkt verwendet werden sollen müssen ein gegebenes Interface implemenieren. Eine Bedingung die sich oft gar nicht erfüllen läßt. Ist die Klasse final, läßt sie sich nicht einmal ableiten...
Verwendet man statt dessen eine Wrapperklasse, muß man eine weitere Klasse definieren die dem Code keine Funktionalität hinzufügt, sonder nur Code zur Verwaltung enthält. Das Ausweichen über anonyme Klassen scheint elegant, erzeugt aber ebenfalls zusätzlichen Code und erzeugt tatsächlich zusätzliche Klassen.
Und jetzt mit Lambdas
Wir erinnern uns: Ein λ-Ausdruck repräsentiert eine Funktion. Was unsere Java-Lösungen oben so schwerfällig erscheinen läßt ist der Versuch eine einzelne Funktion in ein Java-Objekt zu verpacken. Das wird noch dadurch erschwert, daß Java stark typisiert ist und sehr kleinlich bei der Frage welche Eigenschaften die Klasse eines Objekts haben muß damit es verwendet werden kann.
Im Grunde genommen möchten wir doch oben nur die Funktion f(x) -> x
ersetzen durch die Funktion f(x) -> x * x
.
Springen wir also direkt hinein und betrachten einen λ-Ausdruck der die Quadrat-Funktion darstellt. Er wird einer Variable vom Typ unseres oben definierten Interface zugewiesen -- warum das geht betrachten wir später, wir konzentrieren uns zunächst auf den λ-Ausdruck rechts :
Function square = (Integer x) -> { return x * x; }
Ein λ-Ausdruck entspricht der Definition einer mathematischen Funktion.
Links des ->
-Operators (der ist neu in Java 8) steht die Liste der durch Komma getrennten Paranmter mit ihren Typen.
Im Beispiel haben wir einen Parameter vom Typ Integer
.
Rechts des Operators steht der auszuwertende Ausdruck, ein – nahezu – beliebiger Ausdruck, der einen Wert des Ergebnistyps (hier: Integer
) liefert. Der Ergebnistype wird hier nicht explizit angegeben, er ergibt sich aus dem Ausdruck im return-Statement.
Java ist extrem smart was das bestimmen nicht angegebener Typen anbelangt und wir können froh sein, daß uns unsere IDE so viele
Informationen darüber mitteilt.
Wir sehen hier einen λ-Ausdruck in seiner vollen Ausführlichkeit. Um den Ausdruck kompakter und dadurch übersichtlicher zu machen, lassen sich einige Teile weglassen:
Besteht der Ausdruck lediglich aus einem return
-Statement, kann man die Klammern samt return
weglassen:
Function square = (Integer x) -> x * x;
Wenn aus dem Kontext klar ist, welche Typen die Parameter der Parameter-Liste haben, kann man auch die Typen weglassen:
Function square = (x) -> x *x;
Wenn die Parameter-Liste nur einen einzigen Parameter enthält, können wir die Klammern um den Parameter weglassen:
Function square = x -> x *x;
Da square
vom Typ des Interfaces Function
ist, können wir jeden der gezeigten Ausdrücke
verwenden um unsere Methode aufzurufen. Am kompaktesten ist die letzte:
verarbeite(liste, x -> x * x);
λ-Ausdrücke als Interfaces
Wir haben oben -- als wäre das selbstverständlich -- den λ-Ausdruck mit einem Interface gleichgesetzt. Das funktioniert dann, wenn das Interface genau eine (nicht-statische) Funktion definiert deren Typ-Signatur dem λ-Ausdruck entspricht. Das heißt, die Liste der Eingabe-Typen und der Ausgabe-Typ müssen übereinstimmen:
interface Function { Integer apply(Integer x); }
und
Function square = (Integer x) -> { return x * x; }
Man könnte sich vorstellen, daß ein λ-Ausdruck eine ultrakompakte Beschreibung einer anonymen Klasse ist die das Interface implementiert. Diese Vorstellung geht allerdings nicht weit genug.
Tatsächlich ist der λ-Ausdruck gleichwertig ist mit jeder Methode jeder Klasse deren Parameter-Liste die gleichen Typen hat und den gleichen Ergebnis-Typ und das unabhängig davon wie die Metode heißt. Und genau hier liegt die Superkraft des λ-Ausdrucks. Denn auf diese Weise läßt sich jede Methode als λ-Ausdruck verwenden. Wie das geht, wird im nächsten Abschnitt erklärt.
Zudem "implementiert" der λ-Ausdruck jedes Interface das eine einzige Methode besitzt deren typ-Signatur der des λ-Ausdrucks emtspricht also zum Beispiel auch:
interface Blafasel { Integer schnufusel(Integer x); }
Interfaces, die der genannten Regel entsprechen und genau eine nicht-statische Methode haben heißen in Java
"functional Interfaces" und werden meist mit der Annotation @FunctionalInterface
versehen. Die Annotation ist nicht
erforderlich aber hilfreich, da sie verhindert daß das Interface durch Hinzufügen einer weiteren Funktion für λ-Ausdrücke
unbrauchbar machen würde. Der JDK bietet im Package java.util.function
eine ganze Reihe nützlicher Interfaces an,
aber es steht dem Entwickler frei, beliebige Interfaces zu definieren. Bisweilen ist es auch hilfreich nicht die JDK-Interfaces
zu verwenden wenn das Wording nicht zu hundert Prozent paßt.
Methoden als Lambda-Ausdruck
Kommen wir nun zu einigen alternativen Varianten, λ-Ausdrücke zu schreiben. Sie alle verwenden bestehende Methoden um λ-Ausdrücke zu definiern.
statische Methoden
Beginnen wir mit statischen Methoden. Die JDK-Klasse Math
besitzt eine Methode abs()
die den Absolutwert einer
Integerzahl berechnet:
public static int abs(int a) { return (a < 0) ? -a : a; }
An dieser Stelle sei darauf hingewiesen, daß wir hier durch das Autoboxing von Java die Typen Integer
und int
jederzeit gegen einander austauschen können.
Wir können diese Methode nun so verwenden wie oben und in einen λ-Ausdruck verpacken:
verarbeite(liste, x -> Math.abs(x));
Wir können die Methode aber auch mit dem ::
-Operator referenzieren. Dabei wird die Klasse links des Operators
angegeben und Name der Methode rechts:
verarbeite(liste, Math::abs);
nicht-statische Methoden
Das geht auch mit nicht-statischen Methoden. Allerdings benötigen wir dafür ein Objekt auf das sich die Methode
bezieht. Befindet sich die Methode in der gleichen Klasse, können wir this
verwenden:
verarbeite(liste, this::doppel);
Natürlich kann man auch eine Variable verwenden:
Calc c = new Calc(); verarbeite(liste, c::doppel);
oder ein Objekt in place erzeugen:
verarbeite(liste, new Calc()::doppel);
Tatsächlich darf auf der linken Seite des ::
-Operators ein beliebiger Ausdruck stehen der ein Objekt liefert, also zum
Beispiel eine Methode – statisch oder auch nicht – die ein Objekt liefert.
Statische Referenz nicht-statischer Methoden
Die dritte Variante ist auf den ersten Blick ausgesprochen verwirrend, weil sie die beiden vorangegangenen Varianten zu vermischen scheint.
Tatsächlich ist es aber vermutlich die am häufigsten eingesetzte Variante und ist beim Arbeiten mit Streams und Optionals unverzichtbar.
Nehmen wir uns also etwas mehr Zeit dafür:
Wie bei der ersten Variante schreibt man den Namen der Klasse auf der linken Seite des ::
-Operators
und den Namen der (nicht-statischen) Methode auf der rechten Seite:
String::trim
Während die ersten beiden Varianten noch intuitiv verständlich sein dürften, muß man sich fragen, wie
dieser Ausdruck zu interpretieren ist.
Die Methode trim()
der Klasse String
ist nicht statisch. Sie wird auf ein String
-Objekt angewandt und liefert als Ergebnis ebenfalls einen String. Da stellt sich zunächst die Frage, welches funktionale Interface die Methode implementiert?
Probiert man das aus erhält man folgendes verblüffende Ergebnis:
Function<String, String> mapper = String::trim;
Dann ist trim()
also eine Methode, die einen String als Eingabe hat und einen String als Ergebnis liefert?
Ganz falsch ist diese Interpretation nicht, wenn man sich vorstellt, daß der String der getrimmt werden soll nicht in
der Klammer steht, sondern vor dem Punkt:
String foo = " mit Leerzeichen "; foo = foo.trim();
Und genauso wird der Ausdruck String::trim
verwendet. Man benutzt ihn, wenn man eine Methode angeben
möchte, die auf ein Objekt angewendet werden soll (in diesem Falle vom Typ String
).
Die Notation String::trim
könnte man als "normalen" λ-Ausdruck auch so schreiben:
(String s) -> {return s.trim();}
Dieser λ-Ausdruck definiert eine Funktion, die einen String als Parameter übernimmt und dann die Methode trim()
auf diesen Parameter anwendet.
Gerade diese letzte Variante wirkt ohne praktische Anwendung ziemlich akademisch, In der Einführungen zu Optionals gibt es einige praktische Anwendungsbeispiele für solche λ-Ausdrücke.
Ein Wort zu Interfaces
Wir haben Anfangs ein Interface definiert und ihm den Namen Function
gegeben.
Das erschien notwendig, da unsere verarbeite
-Funktion ein Interface für den Parameter-Typ braucht.
Tatsächlich bietet der JDK ein passendes Interface, das allerdings mit Typ-Parameter viel flexibler ist:
package java.util.function; public interface Function<T, R> { R apply(T t); }
Usere λ-Definition sähe damit so aus
Function<Integer, Integer> square = x -> x * x;
Das Package bietet eine ganze Sammlung von Interfaces für viele Zwecke, so daß es eigentlich selten erforderlich ist eigene Interfaces zu definieren. Sinnvoll ist das aber immer dann, wenn λ-Ausdrücke in speziellen Kontexten verwendet werden sollen und das Interface genauer sagen soll was die Funktion machen soll.
Das ändert zunächst nichts an der Austauschbarkeit Typ-äquivalenter Interfaces, über die Typstrenge von Java stolpert man dabei aber dennoch manchmal. Betrachten wir mal folgende Code-Fragmente:
Interface F { Integer apply(Integer x); } ... Integer use(F function) { ... } ... Function<Integer, Integer> square = x -> x * x; Integer bla = use(square);
Hier wirft uns der Compiler in der letzten Zeile einen Compile-Fehler.
Zwar ist der λ-Ausdruck x -> x * x
äquivalent mit dem Interface F
,
die Variable square
jedoch hat einen Typ der nicht in F
konvertierbar ist,
denn es gelten hier die Typ-Regeln für Interfaces.
λ-Ausdrücke und Exceptions
Tatsächlich gehört neben den Typen der Ein- und Ausgabe-Parameter eine vorhandene throws-Clausse an der Methoden-Definition ebenfalls zur Typ-Signatur.
Hier hilft ein Beispiel:
interface Func{ Integer apply(Integer x); } interface FuncEx { Integer apply(Integer x) throws Exception; }
Die beiden Interfaces sind im Sinne der λ-Ausdrücke nicht ineinander konvertierbar.
Das ist eine extrem starke Einschränkung bei der Verwendung von checked Exceptions. Unchecked Exceptions
sind in der Regel kein Problem, weil man sie in der throws
-Clause nicht anzugeben braucht und
sie daher nicht angeben sollte -- sie würden die Signatir natürlich ebenso verunreinigen.
Grundsätzlich giebt es zwei Wege damit umzugehen. Entweder man verzichtet ganz auf die Verwendung von checked Exceptions oder man wrappt -- wo erforderlich -- die checked Exceptions in unchecked Exceptions.
Lambdas mit Kontext
Die oben vorgestellte, zweite Variante läßt sich – anders als die Variante mit der statischen Methode – nicht ohne weiteres als "normaler" λ-Ausdruck schreiben, da zur Ausführung ein Objekt benötigt wird. Hier sehen wir eine weitere Eigenschaft von λ-Ausdrücken: Man kann ihnen nämlich aus dem sie umgebenden Kontext Daten mitgeben:
Calc rechner = new Calc(); Function<Integer, Integer> fkt = (Integer x) -> rechner.doppel(x); this.verarbeite(liste, fkt);
Was geschieht hier? Wir erzeugen zunächst ein Objekt rechner
von Typ Calc
und bauen dann einen λ-Ausdruck
der das Objekt rechner
verwendet um die Methode doppel()
mit einem Integer-Wert auszuführen der als Parameter mitgegeben wird.
Das Objekt kommt aus dem Kontext des λ-Ausdrucks (der Methode in der der Ausdruck erzeugt wird) und wird dem λ-Ausdruck mitgegeben. Man kann dieses Verhalten zum Beispiel dazu nutzen, λ-Ausdrücke mit einer Methode zu erzeugen um sie dann an anderer Stelle zu verwenden:
public Function<Integer, Integer> getRechner() { Calc rechner = new Calc(); return (Integer x) -> rechner.doppel(x); } public void rechne() { this.verarbeite(liste, getRechner()); }
Die Methode getRechner
erzeugt das Calc
-Objekt und baut es in den λ-Ausdruck ein.
Wenn die Methode rechne()
das λ von getRechner
als Ergebnis erhält, ist die Methode getRechner()
zu Ende gelaufen, aber das Objekt das die Variable rechner
referenziert lebt im λ-Ausdruck weiter und wird
nun bei der Verarbeitung verwendet.
Dabei muß man zwei Dinge beachten:
Die Variable rechner
, die das Objekt enthält das hier in den λ-Ausdruck eingearbeitet wird,
muß "effektiv final" sein. Das heißt, ihr Inhalt darf nach der Zuweisung nicht mehr verändert werden.
Folgender Code wird daher nicht kompilieren, da rechner
nachträglich verändert wird:
public Function<Integer, Integer> getRechner() { Calc rechner = new Calc(); Function<Integer, Integer> fkt = (Integer x) -> rechner.doppel(x); rechner = new Calc(); return fkt; }
Das Objekt das durch die Variable rechner
referenziert wird kann aber sehr wohl verändert werden.
Dadurch kann sich das Verhalten des λ-Ausdrucks ändern. Das ist ein generelles Problem in Java,
das keine unveränderbare (immutable) Objekte kennt. Es ist dringend davon abzuraten, solches Verhalten
in λ-Ausdrücke einzuarbeiten, auch wenn es auf den ersten Blick sehr elegant wirkt.
Solches Seiteneffekte führen sehr gerne zu obskuren Fehlern, die nur schwer zu debuggen sind.