Die Reise ins KI-Labyrinth
AutoGPT und das Irrelevante-Ausgabe-Problem
Es ist verrückt, man gibt AutoGPT eine Rolle und 5 Ziele und danach läuft er völlig autark los und kümmert sich um die Erledigung ihrer Ziele.

AutoGPT und das Irrelevante-Ausgabe-Problem
Es ist verrückt, man gibt AutoGPT eine Rolle und 5 Ziele und danach läuft er völlig autark los und kümmert sich um die Erledigung ihrer Ziele.
So weit die Theorie – kommen wir zur Praxis.
Ich habe viel mit AutoGPT probiert, unter anderem immer wieder neue Rollen und Aufgaben verteilt und abgewartet. Es ist spannend, dem Programm zuzusehen, was es als Nächstes für Schritte und Strategien ausführen wird. Am Ende hat man eine Stunde dem Programm zugesehen, wie es 1001 Anfragen an Google stellt, zig tausend Wörter aus den Ergebnissen der Google-Suche rausliest, zusammenfasst, und bestimmt, ob der Content relevant für das Lösen der Aufgabe ist oder nicht.
Nur eines wird er nicht, fertig.
Hier und da verliert er sich in Schleifen und kommt von Höcksken auf Stöcksken versucht Programme zu schreiben, um sich damit selbst in der Lösung der Aufgabe zu unterstützen. Dann merkt er auf einmal, dass er gar keine Programme erstellen darf und vertieft sich in der Recherche über den Aufbau von Computerprogrammen. Das ist alles sehr unterhaltsam, aber vor allem ist es auch teuer. Zur Bearbeitung der Anfrage nutzt AutoGPT die API von ChatGPT und bei dieser Art der Zusammenarbeit nimmt ChatGPT pro „Aktion“ ein paar Cent Bruchteile. Das hört sich erst einmal nicht viel an, summiert sich jedoch schnell, wenn der AutoGPT Agent feststellt, dass er für die Erfüllung des Jobs noch ein paar andere Agenten in alle möglichen Himmelsrichtungen losschicken muss. Da haben wir es wieder, das exponentielle Wachstum.
Zuerst dachte ich – dann bin ich wohl zu blöd, die richtigen Fragen zu stellen.
Nach einer Netzrecherche fand ich aber schnell heraus, dass ich nicht der einzige war, der Probleme mit Schleifen hat. Ganz im Gegenteil, es gab kaum jemanden, der AutoGPT schon mal ein konkretes Ergebnis entlockt hat. Ganze Seiten im Internet sind voll von Promptexperten, die ihre Wege teilen und besprechen. Durch Ändern der Rolle und der Aufträge versuchen sie immer weiterzukommen. Also dem Agenten eine Aufgabe zu stellen die er auch lösen kann.
Trotzdem ist der Reiz groß.
Wer sich jedoch mit dem Thema beschäftigt, der merkt schnell, wo der Reiz ist.
Nämlich in einer riesigen Gemeinde von selbstlosen Programmierern, die einfach Bock haben, an dem Projekt weiterzuarbeiten. Es wird an allen Teilen gleichzeitig entwickelt und somit dem Programm immer mehr Schnittstellen zur Verfügung gestellt. Hier mal die spannendsten Beispiele:
- Webschnittstelle – macht es AutoGPT möglich im Netz zu surfen
- Kurzzeit- und Langzeitgedächtnis – Mit verschiedenen Anbietern von Vektorspeicherlösungen
- Google Such API – Für Netzrecherchen
- Eine richtig gute Programmierschnittstelle – Das ermöglicht AutoGPT bei Softwareentwicklungen selber Test durchzuführen und Codingfehler selbstständig zu verbessern.
(Wer schon mal mit GPT3 oder 4 zusammen Code entwickelt hat, wird wissen, dass sowas nicht beim ersten Mal gleich flutscht.)
Es gibt noch unzählige weitere Projekte, an denen emsig gearbeitet wird, aber schon die 4 da oben machen AutoGPT zu einem mächtigen Werkzeug.
Mich reizt das Thema auch wirklich sehr und ich verspreche ich bleibe da für Sie dran. Wer sich in das Thema auch rein puzzeln will, dem sei empfohlen noch ein paar Tage oder Wochen zu warten, bis die Benutzung nicht mehr ganz so experimentell ist. Es sei denn, sie fühlen sich in Terminalfenstern wohl und wissen wie man Python und Github benutzt.
Ich kann Ihnen das ganze aber gerne mal vorführen, melden sie sich einfach bei mir.