Seite wählen

NemoClaw — KI-Agenten für autonome Computer-Bedienung

NVIDIA’s grundlegendes Framework für KI-Agenten, die Computer bedienen wie Menschen. Automatisieren Sie Legacy-Systeme ohne API — lokal, DSGVO-konform und sofort einsatzbereit.

Was ist NemoClaw?

NemoClaw ist ein KI-Agent-Framework von NVIDIA, das auf der Kombination von NVIDIA NeMo und dem CL-AW-Konzept (Computer Learning Agent Workforce) basiert. Vereinfacht gesagt: NemoClaw ermöglicht es KI-Agenten, einen Computer genauso zu bedienen wie ein menschlicher Mitarbeiter — per Maus, Tastatur und Bildschirm.

Während traditionelle Automatisierungslösungen auf APIs oder fest programmierte Skripte angewiesen sind, geht NemoClaw einen völlig anderen Weg. Das Framework nutzt leistungsstarke Vision Language Models (VLMs), die den Bildschirminhalt „sehen“ und verstehen können. Der KI-Agent erkennt Buttons, Eingabefelder, Menüs und Tabellen visuell — und interagiert mit ihnen genau so, wie es ein Mensch tun würde.

Für Unternehmen im Mittelstand bedeutet das eine fundamentale Veränderung: Software-Systeme, die seit Jahren keine moderne Schnittstelle bieten — ältere SAP-Module, DATEV-Installationen, branchenspezifische Fachsoftware oder proprietäre ERP-Systeme — können nun erstmals vollautomatisch bedient werden, ohne dass eine einzige Zeile Integrationscode geschrieben werden muss.

NemoClaw für Unternehmen — Die autonome digitale Belegschaft

Stellen Sie sich vor, Sie hätten einen Mitarbeiter, der rund um die Uhr arbeitet, niemals Fehler bei der Dateneingabe macht und sich innerhalb von Minuten in jede neue Software einarbeitet. Genau das leistet ein NemoClaw-Agent.

Im Unterschied zu einem klassischen KI-Chatbot, der nur auf Texteingaben reagiert, sieht ein NemoClaw-Agent den Bildschirm, versteht den Kontext und führt komplexe, mehrstufige Aufgaben eigenständig aus. Er öffnet Programme, navigiert durch Menüs, füllt Formulare aus, kopiert Daten zwischen Systemen und überprüft das Ergebnis — vollständig autonom.

Die DATUREX GmbH setzt NemoClaw für mittelständische Unternehmen in Dresden und ganz Sachsen ein, um Prozesse zu automatisieren, die bisher als „nicht automatisierbar“ galten. Unsere Implementierungen laufen ausschließlich auf lokaler Hardware in Ihrem Rechenzentrum — Ihre Geschäftsdaten verlassen niemals Ihr Netzwerk.

Funktionsweise: Wie NemoClaw arbeitet

Die technische Architektur von NemoClaw basiert auf drei Kernkomponenten, die nahtlos zusammenarbeiten:

1. Vision Language Model (VLM) — Das „Auge“ des Agenten

Ein hochleistungsfähiges Vision Language Model analysiert den aktuellen Bildschirminhalt in Echtzeit. Es erkennt UI-Elemente (Buttons, Dropdowns, Eingabefelder, Tabellen), liest Texte und versteht die semantische Bedeutung dessen, was auf dem Bildschirm dargestellt wird. Das Modell verarbeitet Screenshots mit einer Auflösung, die auch kleine Schriftgrößen und komplexe Layouts zuverlässig erfasst.

2. Reasoning Engine — Das „Gehirn“ des Agenten

Basierend auf dem visuellen Input plant die Reasoning Engine die nächsten Schritte. Sie zerlegt komplexe Aufgaben in einzelne Aktionsschritte, evaluiert Zwischenergebnisse und passt die Strategie dynamisch an. Wenn ein Dialog unerwartet erscheint oder ein Feld anders beschriftet ist als erwartet, erkennt der Agent das und reagiert flexibel — genau wie ein erfahrener Sachbearbeiter.

3. Action Layer — Die „Hände“ des Agenten

Der Action Layer setzt die geplanten Aktionen in konkrete Maus- und Tastaturereignisse um: Klicks, Texteingaben, Scrollen, Drag-and-Drop, Tastenkombinationen. Jede Aktion wird mit Pixel-Präzision ausgeführt. Zusätzlich kann der Agent Browser-basierte Aufgaben durchführen — Websites navigieren, Formulare ausfüllen, Downloads starten und Daten aus Webportalen extrahieren.

Anwendungsfälle im Mittelstand

NemoClaw entfaltet seinen größten Nutzen dort, wo bestehende Software keine APIs bietet oder wo die Integration über Schnittstellen zu aufwändig wäre. Hier die wichtigsten Einsatzszenarien für mittelständische Unternehmen:

Automatisierte Dateneingabe in Legacy-Systeme (SAP, DATEV)

Viele Unternehmen arbeiten mit ERP-Systemen, die seit Jahren zuverlässig laufen — aber keine moderne REST-API bieten. Bisher mussten Mitarbeiter Daten manuell in SAP-Masken, DATEV-Oberflächen oder branchenspezifische Fachsoftware eingeben. Ein NemoClaw-Agent übernimmt diese Dateneingabe: Er öffnet die Anwendung, navigiert zur richtigen Maske, gibt die Daten ein und bestätigt die Buchung. Bei tausenden Buchungen pro Monat spart das hunderte Arbeitsstunden.

Praxisbeispiel: Ein Dresdner Handelsunternehmen mit 120 Mitarbeitern erfasst monatlich ca. 3.000 Eingangsrechnungen in SAP. Die manuelle Eingabe dauert durchschnittlich 4 Minuten pro Rechnung. Der NemoClaw-Agent reduziert die Bearbeitungszeit auf unter 30 Sekunden pro Vorgang — eine Einsparung von über 170 Stunden pro Monat.

Web-Recherche und Datenextraktion

Der Agent kann systematisch Websites durchsuchen, Preislisten vergleichen, Lieferantendaten aktualisieren oder Marktdaten zusammentragen. Im Gegensatz zu klassischen Web-Scraping-Tools versteht NemoClaw den Seitenkontext semantisch und kann auch mit dynamisch geladenen Inhalten, Cookie-Bannern und CAPTCHAs umgehen.

Praxisbeispiel: Ein Einkaufsteam muss wöchentlich Preise bei 50 Lieferanten prüfen. Der Agent navigiert automatisch zu jedem Lieferantenportal, meldet sich an, extrahiert die aktuellen Preise und erstellt eine konsolidierte Vergleichstabelle — ein Prozess, der manuell 2 volle Arbeitstage dauerte und nun in 3 Stunden erledigt ist.

Formularausfüllung und Dokumentenverarbeitung

Behördenformulare, Versicherungsanträge, Zolldokumente, Förderanträge — die deutsche Bürokratie lebt von Formularen. NemoClaw-Agenten füllen diese Formulare automatisch aus, indem sie die benötigten Daten aus Ihren Systemen extrahieren und in die entsprechenden Felder eintragen. Das funktioniert sowohl mit PDF-Formularen als auch mit Web-basierten Eingabemasken.

Software-Testing und QA-Automatisierung

Für Unternehmen, die eigene Software entwickeln oder regelmäßig Updates testen müssen, bietet NemoClaw eine intelligente Alternative zu starren Testskripten. Der Agent kann Benutzerszenarien durchspielen, unerwartete Dialoge handhaben und visuelle Abweichungen erkennen. Änderungen im UI-Layout, die herkömmliche Testautomatisierung zum Scheitern bringen, meistert NemoClaw dank seiner visuellen Intelligenz mühelos.

Automatisierte Reporting und Dashboard-Updates

Viele Unternehmen erstellen regelmäßig Reports, indem sie Daten aus verschiedenen Systemen manuell zusammentragen — aus dem CRM, dem ERP, der Buchhaltungssoftware und verschiedenen Excel-Dateien. Ein NemoClaw-Agent navigiert durch all diese Systeme, extrahiert die relevanten Kennzahlen und konsolidiert sie in einem zentralen Dashboard oder einer Präsentation. Der wöchentliche Management-Report, für den bisher ein halber Tag eingeplant war, ist in 20 Minuten fertig.

NemoClaw vs. klassische RPA — Warum der Paradigmenwechsel überfällig ist

Robotic Process Automation (RPA) war die erste Generation der Desktop-Automatisierung. Werkzeuge wie UiPath oder Blue Prism automatisieren Prozesse über fest definierte Klickpfade und Selektoren. Das funktioniert — solange sich an der Software nichts ändert.

In der Praxis scheitert klassische RPA häufig an einem simplen Problem: Ein Software-Update verschiebt einen Button um 10 Pixel, eine Dialogbox erscheint unerwartet, oder ein Feld ist plötzlich anders beschriftet. Der RPA-Bot bricht ab und muss von einem Entwickler angepasst werden. Diese Wartungskosten fressen oft den gesamten Automatisierungsvorteil auf.

NemoClaw löst dieses Problem grundsätzlich:

  • Keine API nötig: Der Agent „sieht“ den Bildschirm und braucht weder Schnittstellen noch Selektoren
  • Visuelles Verständnis: Änderungen im UI-Layout werden automatisch erkannt und kompensiert
  • Kontextbasierte Entscheidungen: Der Agent versteht, was er tut — nicht nur, wohin er klicken soll
  • Flexible Fehlerbehandlung: Unerwartete Dialoge, Fehlermeldungen oder geänderte Workflows werden intelligent gehandhabt
  • Schnellere Implementierung: Statt wochenlanger Klickpfad-Programmierung reicht eine natürlichsprachliche Aufgabenbeschreibung
  • Geringere Wartungskosten: Da der Agent visuell statt über Selektoren arbeitet, sind Software-Updates kein Problem mehr

Für Unternehmen, die bereits in RPA investiert haben, ist NemoClaw kein Ersatz, sondern eine Ergänzung. Stabile, API-basierte Automatisierungen bleiben bestehen. NemoClaw übernimmt die Prozesse, bei denen RPA an seine Grenzen stößt.

Lokales Deployment — DSGVO-konform und datensouverän

Ein zentrales Anliegen mittelständischer Unternehmen ist die DSGVO-Konformität. Wenn ein KI-Agent Screenshots Ihres ERP-Systems macht und diese zur Analyse an eine Cloud sendet, entstehen erhebliche datenschutzrechtliche Risiken.

Deshalb setzen wir bei der DATUREX GmbH auf ausschließlich lokale Deployments. Die gesamte NemoClaw-Infrastruktur läuft auf Hardware in Ihrem Rechenzentrum oder auf dedizierten Servern in einem deutschen Rechenzentrum Ihrer Wahl:

  • Keine Cloud-Anbindung: Screenshots und Bildschirmdaten werden lokal verarbeitet und niemals an externe Server übertragen
  • Volle Datensouveränität: Sie behalten die physische Kontrolle über alle Daten und Modelle
  • DSGVO-Konformität: Keine Auftragsverarbeitung durch Dritte, keine Drittlandübermittlung
  • Air-Gap-fähig: Für besonders sensible Umgebungen kann NemoClaw vollständig ohne Internetverbindung betrieben werden
  • Informationssicherheit: Auf Wunsch implementieren wir Sicherheitsmaßnahmen nach ISO 27001

Hardware-Anforderungen für lokales NemoClaw

Die Anforderungen hängen von der Komplexität und Parallelität der Aufgaben ab:

  • Einstieg (1 Agent): 1x NVIDIA RTX 4090 oder A6000, 64 GB RAM, 1 TB NVMe SSD — ab ca. 5.000 Euro
  • Standard (3-5 Agenten parallel): 2x NVIDIA A6000 oder 1x A100, 128 GB RAM — ab ca. 15.000 Euro
  • Enterprise (10+ Agenten parallel): Multi-GPU-Server mit NVIDIA H100 oder A100-Cluster — auf Anfrage

Alternativ bieten wir auch Managed-Hosting auf dedizierten Servern in einem deutschen Rechenzentrum an — ohne die Anschaffungskosten für eigene Hardware.

DATUREX als Ihr NemoClaw-Implementierungspartner

Die DATUREX GmbH aus Dresden ist spezialisiert auf die Implementierung von KI-Agenten für den Mittelstand. Unser Team kombiniert Expertise in KI-Lösungen, Workflow-Automatisierung mit n8n und lokalem KI-Hosting zu einem umfassenden Automatisierungsansatz.

Was uns als NemoClaw-Partner auszeichnet:

  • Prozessverständnis: Wir kennen die Abläufe im Mittelstand — von der Buchhaltung über den Vertrieb bis zur Fertigung
  • Lokale KI-Expertise: Wir betreiben ausschließlich lokale KI-Infrastruktur — keine Cloud-Abhängigkeit
  • Datenschutz-Kompetenz: Als Unternehmen, das auch Datenschutzberatung anbietet, verstehen wir die rechtlichen Anforderungen von Grund auf
  • n8n-Integration: NemoClaw-Agenten werden in bestehende Workflow-Systeme eingebettet, nicht isoliert betrieben
  • Sachsenweiter Service: Vor-Ort-Support in Dresden und ganz Sachsen, Remote-Support bundesweit

Kosten und Einstieg — Der Weg zu Ihrem ersten NemoClaw-Agenten

Wir empfehlen einen stufenweisen Einstieg, der Risiken minimiert und schnelle Erfolgserlebnisse schafft:

Stufe 1: Kostenloser NemoClaw Workshop (1 Tag)

Wir analysieren gemeinsam Ihre Prozesslandschaft und identifizieren die 3-5 vielversprechendsten Automatisierungskandidaten. Sie erhalten eine Machbarkeitsbewertung und eine erste ROI-Schätzung — kostenlos und unverbindlich.

Stufe 2: Proof of Concept (2-3 Wochen, ab 5.000 Euro)

Wir implementieren einen funktionsfähigen NemoClaw-Agenten für Ihren wichtigsten Prozess. Sie sehen in einer Live-Demo, wie der Agent Ihre konkrete Software bedient — mit Ihren echten Daten in einer Testumgebung.

Stufe 3: Pilotprojekt (4-8 Wochen, ab 15.000 Euro)

Der Agent geht in den Produktivbetrieb. Er arbeitet zunächst unter menschlicher Aufsicht (Human-in-the-Loop), bis die Qualität nachweislich stimmt. Parallel entwickeln wir weitere Agenten für zusätzliche Prozesse.

Stufe 4: Skalierung (laufend, ab 1.500 Euro/Monat)

Kontinuierliche Erweiterung der Agent-Flotte: neue Prozesse automatisieren, bestehende Agenten optimieren, Hardware skalieren. Sie zahlen einen monatlichen Managed-Service-Betrag, der Monitoring, Wartung und Weiterentwicklung umfasst.

Häufig gestellte Fragen zu NemoClaw

Was genau ist NemoClaw?

NemoClaw ist ein KI-Agent-Framework von NVIDIA, das auf Vision Language Models basiert. Es ermöglicht KI-Agenten, Computer visuell zu bedienen — per Maus, Tastatur und Bildschirmanalyse. Im Gegensatz zu klassischen Automatisierungstools benötigt NemoClaw keine APIs oder Schnittstellen.

Wie unterscheidet sich NemoClaw von RPA?

Klassische RPA-Tools (wie UiPath oder Blue Prism) arbeiten mit fest programmierten Klickpfaden und Selektoren. Wenn sich die Software ändert, bricht der Bot ab. NemoClaw hingegen „sieht“ den Bildschirm wie ein Mensch und passt sich flexibel an UI-Änderungen an. Das reduziert Wartungskosten erheblich.

Ist NemoClaw DSGVO-konform einsetzbar?

Ja — wenn es lokal betrieben wird. Die DATUREX GmbH setzt NemoClaw ausschließlich auf lokaler Hardware oder in deutschen Rechenzentren ein. Keine Bildschirmdaten werden an externe Cloud-Dienste übertragen. Damit erfüllt die Lösung alle Anforderungen der DSGVO.

Welche Software kann NemoClaw automatisieren?

Grundsätzlich jede Software mit einer grafischen Benutzeroberfläche: SAP, DATEV, Microsoft Office, Legacy-ERP-Systeme, Web-Anwendungen, branchenspezifische Fachsoftware, Windows-Desktop-Anwendungen und mehr. Der Agent braucht keine API — er bedient die Software visuell.

Wie lange dauert die Implementierung eines NemoClaw-Agenten?

Ein einzelner Agent für einen definierten Prozess kann innerhalb von 2-3 Wochen als Proof of Concept implementiert werden. Der Übergang in den Produktivbetrieb dauert typischerweise weitere 4-6 Wochen inklusive Testphase und Feinoptimierung.

Was kostet NemoClaw für ein mittelständisches Unternehmen?

Der Einstieg beginnt bei ca. 5.000 Euro für einen Proof of Concept. Ein vollständiges Pilotprojekt mit 3-5 Agenten liegt bei 15.000-30.000 Euro. Die laufenden Kosten für Managed Service betragen ab 1.500 Euro pro Monat. Die Investition amortisiert sich typischerweise innerhalb von 3-6 Monaten.

Projekt starten

Lassen Sie uns über Ihr Projekt sprechen. Kostenlose Erstberatung.

Telefon: 0351 / 79593513

📞 0351 / 79 59 35 13 Projekt besprechen