
Google Gemma mit einem selbst gehosteten Gemma-4-Modell recherchieren und einen thematischen HTML-Bericht erstellen
Die Recherche zu einer neuen KI-Modellfamilie bedeutet, mehrere Quellen zu jonglieren, Erkenntnisse zusammenzuführen und alles anschließend in ein präsentationsreifes Ergebnis zu bringen. Dieser Workflow zeigt, wie Eigent diese gesamte Pipeline eliminiert — angetrieben von einem lokal gehosteten Gemma-4-31B-Modell, das über vLLM läuft, orchestriert es mehrere Agents, um aus einer einzigen Eingabeaufforderung heraus zu recherchieren, zu schreiben, zu gestalten und eine ausgefeilte HTML-Seite bereitzustellen.
Bemerkenswert an dieser Demo ist, dass der gesamte Workflow — Multi-Agent-Orchestrierung, Live-Web-Recherche, skillbasierte Dokumentgenerierung und thematisch gestaltete HTML-Ausgabe — von einem Open-Weight-Modell mit 31 Milliarden Parametern auf Ihrer eigenen Hardware angetrieben wird.
Gemma 4 in Eigent als Ihr Modell konfigurieren
Gehen Sie zu Settings → Agents → vLLM und setzen Sie die Model Endpoint URL auf Ihre lokal gehostete Instanz (z. B. http://localhost:8000/v1) und den Model Type auf gemma4-31b.
Damit weist Eigent alle Agent-Aufgaben an, über Ihre selbst gehostete Gemma-4-Instanz statt über eine Cloud-API zu laufen, wodurch Ihre Daten lokal bleiben und Ihre Inferenzkosten bei null liegen.
Die Agent-Skills herunterladen und importieren
Gehen Sie zum Eigent Skills Hub unter eigent.ai/skills und laden Sie die Skill-Pakete doc-coauthoring und theme-factory als ZIP-Dateien herunter.
Zurück in Eigent gehen Sie zu Settings → Agents → Skills und verwenden den Dialog Add Skill, um beide ZIP-Dateien per Drag-and-drop hinzuzufügen. Jedes Skill-Paket enthält eine SKILL.md-Datei, die Eigent mitteilt, wann und wie der Skill aktiviert werden soll. Der theme-factory-Skill enthält außerdem 10 vorgefertigte Theme-Definitionen mit kuratierten Farbpaletten und Schriftarten-Kombinationen.
Die Recherche-Eingabeaufforderung absenden
Sobald die Skills importiert und Gemma 4 konfiguriert sind, geben Sie Ihre Aufgaben-Eingabe in Eigents Chat-Eingabefeld ein:
Recherchiere die Gemma-Familie anhand von Reuters, TechCrunch, der Unternehmenswebsite und offizieller Dokumentation. Verwende dann {{doc-coauthoring}} und {{theme-factory}}, um eine ausgefeilte HTML-Seite mit zentralen Erkenntnissen, Vergleichen und nächsten Schritten zu erstellen. Speichere die HTML-Datei im Workspace-Ordner.
Die Verweise {{doc-coauthoring}} und {{theme-factory}} teilen Eigent mit, beide Skills für diesen Workflow zu aktivieren. Eigent beginnt sofort mit der Planung der Ausführung.
Beobachten Sie, wie Eigent die Aufgabe zerlegt und plant
Gemma 4 analysiert die Eingabeaufforderung und zerlegt sie in zwei sequenzielle Aufgaben:
-
Rechercheaufgabe: Recherchieren Sie die Gemma-Modellfamilie anhand von Reuters, TechCrunch, der offiziellen Google-Website und der offiziellen Dokumentation. Extrahieren Sie zentrale Erkenntnisse, Modellvergleiche und empfohlene nächste Schritte. Geben Sie eine detaillierte Recherche-Zusammenfassung im Markdown-Format mit drei Abschnitten aus: "Key Findings", "Comparisons" und "Next Steps".
-
HTML-Generierungsaufgabe: Verwenden Sie auf Grundlage der bereitgestellten Recherche-Zusammenfassung die Skills
doc-coauthoringundtheme-factory, um eine ausgefeilte, professionelle HTML-Seite zu erstellen. Speichern Sie die fertige HTML-Datei im Arbeitsverzeichnis.
Diese Aufgabenzerlegung erfolgt automatisch — Gemma 4 versteht die Abhängigkeiten und ordnet die Arbeit entsprechend an.
Die Multi-Agent-Orchestrierung startet
Eigent startet mehrere spezialisierte Agents parallel, um den Plan auszuführen:
-
Browser Agent startet parallele Browser-Sitzungen, um im Web zu recherchieren. Er besucht gleichzeitig Google Search, Reuters, TechCrunch, die offizielle Google-DeepMind-Seite für Gemma und den Google-AI-Blog — alles gleichzeitig, um den Durchsatz zu maximieren.
-
Developer Agent steht mit seiner ausstehenden Aufgabe bereit und wartet auf die Recherche-Zusammenfassung, bevor er mit der HTML-Generierung fortfährt.
Der Browser Agent nutzt Gemma 4s großes Kontextfenster aus, indem er mehrere Webseiten gleichzeitig verarbeitet und relevante Informationen über Architektur, Bereitstellungsoptionen, Ökosystem und Lizenzierung der Gemma-Modellfamilie extrahiert.
Der Browser Agent liefert die Recherche-Zusammenfassung
Nachdem alle angegebenen Quellen besucht wurden, erstellt der Browser Agent einen strukturierten Completion Report mit der zusammengeführten Recherche. Der Bericht umfasst:
-
Key Findings: Gemma ist eine Familie leichter, hochmoderner Open-Weight-Modelle, entwickelt von Google DeepMind und auf derselben Technologie wie die Gemini-Modelle aufgebaut. Das Ökosystem ist auf Effizienz ausgelegt und ermöglicht Entwicklern, KI-Anwendungen zu bauen, die lokal auf verschiedenster Hardware laufen können.
-
Core Characteristics: Architektonische Grundlage auf Basis von Gemini-Forschung; stark optimiert für On-Device- und lokale Ausführung; zugänglich über Hugging Face, Kaggle, Vertex AI, Ollama und LM Studio; Ökosystemwachstum von über 110 Millionen Downloads; Open-Weight-Lizenzierung mit benutzerdefinierten Lizenzbedingungen für die kommerzielle Nutzung.
-
Comparisons with GPT-4: Während GPT-4 ein groß angelegtes multimodales Modell ist, das typischerweise über API oder Cloud genutzt wird, bietet Gemma eine Open-Weights-Alternative, die lokale Bereitstellung, vollständige Fine-Tuning-Kontrolle und Offline-Betrieb ermöglicht.
-
Next Steps: Empfohlene Maßnahmen einschließlich Integrationsentwicklung, Tests für On-Device-Bereitstellung, spezialisierte Anwendungsfälle und Skalierungsoptionen.
Diese Markdown-Recherche-Zusammenfassung wird automatisch als Eingabe an den Developer Agent für die nächste Phase übergeben.
Der Developer Agent übernimmt die Skills und generiert das HTML
Der Developer Agent erhält die Recherche-Zusammenfassung und aktiviert beide Skills. Er liest die doc-coauthoring-SKILL.md, um den strukturierten Dokument-Workflow zu verstehen, und die theme-factory-SKILL.md, um auf die kuratierte Theme-Sammlung zuzugreifen.
Mit dem Terminal führt der Developer Agent folgende Schritte aus:
- Ruft verfügbare Skills ab, um doc-coauthoring und theme-factory zu finden
- Liest die Theme-Showcase, um ein passendes visuelles Theme auszuwählen
- Erstellt das Projektverzeichnis im Workspace
- Schreibt eine vollständige, eigenständige HTML-Datei, die den Rechercheinhalt mit der Farbpalette und Typografie des ausgewählten Themes kombiniert
Der Developer Agent wendet die Hex-Codes, Schriftarten-Kombinationen und visuelle Identität des Themes auf alle Abschnitte an — Überschriften, Fließtext, Kartenkomponenten und Hintergrundelemente — und erzeugt so ein Ergebnis, das wie von einem professionellen Designer handgefertigt aussieht.
Den fertigen thematischen HTML-Bericht überprüfen
Die fertige HTML-Seite wird direkt im Workspace-Ordner gespeichert. Beim Öffnen zeigt sie einen ausgefeilten, dunkel gestalteten Bericht mit dem Titel "Google Gemma Family of Models — Advanced Research Summary & Strategic Analysis" mit:
- einem Key Findings-Abschnitt mit stilisierten Aufzählungspunkten zu Gemmas Architektur, Bereitstellungsmerkmalen, Zugänglichkeit, Ökosystemwachstum und Lizenzbedingungen
- einer Comparisons-Matrix, die Gemma mit cloudbasierten Alternativen wie GPT-4 vergleicht
- einem Next Steps-Abschnitt mit umsetzbaren Empfehlungen für Integrationsentwicklung, On-Device-Bereitstellung, spezialisierte Anwendungsfälle und Skalierung
- einer professionellen Fußzeile mit Quellenangabe
Die gesamte Seite ist responsiv, in einer einzigen HTML-Datei eigenständig enthalten und bereit, mit Stakeholdern geteilt oder intern veröffentlicht zu werden — alles generiert von einem Open-Weight-Modell mit 31 Milliarden Parametern, das auf lokaler Hardware läuft.
Warum dieser Workflow wichtig ist
Diese Demo zeigt drei Fähigkeiten, die zusammenwirken:
- Open-Weight-Modell-Power: Gemma 4 31B, lokal über vLLM ausgeführt, bewältigt komplexe Multi-Agent-Orchestrierung, Live-Web-Recherche und Codegenerierung — Aufgaben, die typischerweise mit wesentlich größeren cloud-gehosteten Modellen verbunden sind.
- Skill-Kombination: Die Skills doc-coauthoring und theme-factory lassen sich nahtlos kombinieren. Keiner der Skills weiß vom anderen; Eigent orchestriert sie zu einer einzigen Pipeline.
- Multi-Agent-Parallelität: Der Browser Agent recherchiert parallel in mehreren Quellen, während der Developer Agent auf die strukturierte Übergabe wartet, wodurch der Durchsatz maximiert wird, ohne die Qualität zu beeinträchtigen.
Was Sie als Nächstes ausprobieren können
Sobald der erste Bericht generiert wurde, können Sie darauf mit Folgeaufforderungen aufbauen, wie zum Beispiel:
Tausche das Theme gegen "Arctic Frost" aus und generiere denselben Bericht neu.
Ersetze die Gemma-Recherche durch eine tiefgehende Analyse einer anderen KI-Modellfamilie.
Füge den pptx-Skill hinzu, um aus derselben Recherche eine Präsentation zu erstellen.
Führe denselben Workflow mit einer anderen Gemma-Variante aus, um die Ausgabequalität über verschiedene Modellgrößen hinweg zu vergleichen.
Tipps für bessere Ergebnisse
- Quellen explizit benennen. Die Angabe von Reuters, TechCrunch und offizieller Dokumentation gibt dem Browser Agent einen klaren Recherchepfad statt einer offenen Suche.
- Doppelklammer-Skill-Verweise verwenden. Das Schreiben von
{{doc-coauthoring}}und{{theme-factory}}in Ihrer Eingabeaufforderung aktiviert diese importierten Skills ausdrücklich. - Den Ausgabepfad angeben. Die Aufforderung, die "HTML-Datei im Workspace-Ordner zu speichern", sagt dem Developer Agent genau, wohin er das fertige Ergebnis schreiben soll.
- Das Modell planen lassen. Gemma 4s Aufgabenzerlegung ist am effektivsten, wenn Sie das gewünschte Ergebnis beschreiben, statt einzelne Schritte vorzugeben.


