ProjectAI ist ein in Python geschriebenes Workflow-Framework, dass ich derzeitig hauptsächlich im Finanzwesen (Börsenhandel) nutze, um solide Aktien ausfindig zu machen. Noch hat das Kind keinen finalen Namen, intern nenne ich es aber schlicht ProjectAI.
Es ermöglicht, lokale und Cloud-basierte KI-Modelle nahtlos über Schnittstellen in bestehende, fremde Ökosysteme zu integrieren. Ein Workflow definiert einen sequenziellen Ablauf von Datenabrufen, Aktionen und Signalen über Module. Die Daten und Resultate von Workflows werden mittels JINJA2 Templates für die KI inhaltlich aufbereitet übergeben. Es steckt aktuell noch in einer frühen Entwicklung, aber es werden hier in zeitlichen Abständen die Analysen Resultate aus Testläufen hochgeladen, in der Hoffnung dass diese dem ein oder anderen helfen.
KI-Nachrichten sind allgegenwärtig, vielen geht das Thema mittlerweile fast schon auf die Nerven, während wieder andere darin eine fundamentale Bedrohung sehen.
Ich betrachte die Entwicklung gelassen: Eine KI sollte den Menschen ergänzen, nicht ersetzen. Warum also nicht das enorme Potenzial produktiv nutzen?
Rückblickend war und ist es für mich weit mehr als nur ein Projekt. Es war eine intensive Exkursion durch die Welt der künstlichen Intelligenz – voller Aha-Erlebnisse und verbunden mit einem massiven Wissensaufbau über technische Zusammenhänge sowie die noch bestehenden Grenzen der Technologie. Mehr dazu in der Vorgeschichte.
Ende 2024 wollte ich wissen, wie tief sich eine KI mit häuslichen Mitteln in den Börsenhandel integrieren lässt. Was als kleines Experiment startete, hat sich inzwischen zu einem ernstzunehmenden Softwareprojekt entwickelt.
Machen wir uns nichts vor: Nirgendwo sonst trifft man auf so viele egozentrische Überredungskünstler wie im kapitalgetriebenen Finanzsektor.
Ihr Ziel? Kleinanleger gezielt in gehypte Aktien zu treiben, um Kurse künstlich zu pushen. By the way: Die Versicherungsbranche steht dem übrigens in nichts nach.
Zwar gibt es namhafte Big-Player, die derartige KI-Analysedienste anbieten, allerdings zu horrenden Abopreisen – für gelegentliche Privatanleger ist das völlig unwirtschaftlich. Daher begann ich, mit lokalen Modellen zu experimentieren. Ich wollte ein Gefühl dafür bekommen, wie sich kompakte, lokal betriebene Open-Source-Modelle im Vergleich zu den großen, bekannten Cloud-Modellen schlagen. Meine KI-Erfahrungen waren zu diesem Zeitpunkt noch rein grundlegender Natur.
Meine ersten Versuche basierten auf den Modellen BERT und BART (für Textzusammenfassungen), Qwen, DeepSeek, Ace Reason und NVIDIA's Nemotron-Reasoning-Modellen (für logische Operationen) sowie Llama, Mistral und Mixtral (für textuelle Auswertungen) bis hin zum aktuell eingesetzten Google Gemma 4, das hier in drei Ausführungen arbeitet und einen enormen Fortschritt zeigt. Mithilfe von Ollama, Oobabooga und aktuell KoboldCpp, habe ich die Modelle systematisch evaluiert und Benchmarks unterzogen.
Dabei zeigten sich schnell die drastischen Unterschiede in den Modellarchitekturen: Große Modelle hielten zwar mal mehr mal weniger fast fehlerfrei den roten Faden, waren auf einer reinen CPU jedoch quälend langsam. Kleine Modelle agierten zwar extrem flink, blieben dafür oberflächlich, verloren schnell den Kontext und begannen zu halluzinieren.
Um die Grenzen auszuloten, entwickelte ich ein Needle-in-a-Haystack-Szenario (Die Nadel im Heuhaufen). Ich fütterte die Modelle mit umfangreichen SEC-Finanzberichten von Unternehmen und setzte sie gezielt auf die Daten an. Über penibel optimierte Prompts (KI Persona und Anweisungen) ließ ich sie nach versteckten Risiken suchen:
Besonders wichtig war mir dabei der Abgleich zwischen euphorischen PR-Aussagen und den nackten Zahlen der SEC-Dokumente.
Die kleinen Modelle scheiterten erwartungsgemäß, ihnen fehlte die kognitive Tiefe für derart komplexe Analysen. Größere Modelle erkannten immerhin bis zu 80 % der versteckten Informationen. Der eigentliche Durchbruch gelang jedoch erst, als ich die Gesamtaufgabe in kleinere Teilaufgaben splittete.
Vor mir lagen nun zwei Wege:
Fasziniert von der zweiten Option, die sich zur Not mit einem kostenpflichtigen Abo Modell kombinieren lässen würde - sofern die Ergebnisse nicht überzeugen, begann ich mit der Entwicklung eines eigenen Python-Frameworks, das folgende Kernkriterien erfüllt:
Obwohl mein Fokus ursprünglich auf dem Finanzwesen lag, sind die Einsatzmöglichkeiten schlicht unbegrenzt. Die Workflows lassen sich tiefgreifend individualisieren. Module können nicht nur Daten beschaffen, sondern auch Workflows / KI's triggern. Dadurch agiert die KI proaktiv statt nur reaktiv.
In der ersten Version von ProjectAI nutzte ich transformers und llama.cpp, um die lokalen Modelle nativ anzusprechen. Die Sessions und die Memory-Funktion stellten sicher, dass wesentliche Informationen nicht verloren gingen. Um die Hardwarebeschränkungen zu Hause zu lösen, wurden die lokalen Modelle per Clustering im LAN auf meine PCs verteilt. Aufgaben wurden so vollautomatisch an freie Ressourcen und nach Eignung der Modelle vergeben. ProjectAI läuft in dieser Konfiguration seit einiger Zeit erfolgreich auf meinem Home-Server als Master-Instanz.
Zusätzlich wäre auch eine aktuelle Grafikkarte zur KI Beschleunigung ideal, zu dem Zeitpunkt schoßen die Preise jedoch in die Höhe, weswegen ich lange zögerte. Inzwischen habe ich aber für einen guten Kurs eine Sapphire Radeon 9600XT ergattern können, der Geschwindigkeitssprung im Vergleich zur reinen CPU Berechnung, ist milde ausgedrückt, enorm.
ProjectAI 2.0 ist ein reiner lokaler MCP Tool Server der Workflows abarbeitet, im Grunde ein extrem abgespecktes ProjectAI 1.0, dass nur Tools bzw. Workflows zur Verfügung stellt. Die Datenstruktur ist identisch zur Vorversion, jedoch nur für den reinen lokalen Einsatz mit KoboldCpp, Gemini-CLI, Codex etc., geeignet.
ProjectAI 3.0 ist ein wieder etwas anderer Ansatz und wird aktuell intensiv von mir weiterentwickelt: Ein standalone Framework, service-orientierter Gateway, der mittels MCP Schnittstelle (fastmcp) lokal oder entfernt an Clients angebunden werden kann. Es kombiniert quasi die Features von V1 und V2 und macht den Einsatz universell, beherbergt zusätzlich ein Dashboard sowie Skills und einen Watchdog (Daemon) der zeitliche Aktionen triggert.