ChatGPT auf dem Desktop: Der Startschuss für KI-Agenten
Die ChatGPT-App für macOS (die noch dieses Jahr auch für Windows verfügbar sein soll) ist jetzt für alle Nutzer verfügbar. Das klingt erst mal wenig spektakulär, ist meiner Meinung nach aber der erste Schritt dahin, KI-Agenten den Zugriff auf unseren Computer und damit unsere Apps, E-Mails, Kalender, Dateien und vieles mehr zu geben. Bis ChatGPT über deinen Bildschirm navigieren wird, werden allerdings noch ein paar Monate vergehen. Daher starten wir mit einem Beispiel, wie du die App schon heute nutzen kannst, um produktiver und effizienter mit ChatGPT zu arbeiten.
Ich habe gestern den aktuellen Beitrag von Ethan Mollick auf seinem Blog gelesen und wollte die Prompts aus folgendem Screenshot extrahieren.
Mit dem Shortcut Option + Space auf der Tastatur kann man die ChatGPT-App öffnen, egal wo man gerade ist.
Mit einem Klick auf die Klammer kann man dann direkt einen Screenshot von der aktuellen App (oder auch jeder anderen App) machen.
Zum Screenshot kann dann der Text-Prompt ergänzt werden, und die Anfrage wird abgeschickt.
Durch die hohe Ausgabegeschwindigkeit von GPT-4 ist das Ergebnis wenige Sekunden später verfügbar, und die Prompts wurden erfolgreich aus dem Screenshot extrahiert.
Ich bin überzeugt, dass wir für eine erfolgreiche KI-Einführung in Unternehmen möglichst viele Hürden abbauen müssen. Dazu gehört unter anderem, dass die Zusammenarbeit mit KI-Assistenten so einfach wie möglich sein sollte. Die ChatGPT-App ist ein wichtiger Schritt, um genau das zu erreichen.
Hier sind ein paar weitere Ideen, wie du die ChatGPT-App in deiner täglichen Arbeit einsetzen kannst:
Übersetzung von Bildinhalten: Du kannst fremdsprachige Texte abfotografieren und sie dir direkt übersetzen lassen, ohne den Text manuell abtippen zu müssen.
Datenextraktion aus Tabellen: Du kannst komplexe Tabellen oder Diagramme screenshotten und ChatGPT bitten, spezifische Daten zu extrahieren oder Zusammenfassungen zu erstellen.
Schnelle Recherche: Beim Lesen von Artikeln oder Büchern kannst du interessante Passagen abfotografieren und ChatGPT um weiterführende Informationen oder Erklärungen bitten.
Formatierungshilfe: Du kannst Screenshots von komplexen Layouts oder Designs machen und ChatGPT um Vorschläge zur Verbesserung oder Anpassung bitten.
Schnelle Zusammenfassungen: Bei langen Texten oder Präsentationen kannst du Screenshots machen und ChatGPT um eine knappe Zusammenfassung der Hauptpunkte bitten.
Schnelles Fact-Checking: Bei fragwürdigen Behauptungen oder Statistiken in Artikeln oder Social-Media-Posts kannst du einen Screenshot machen und ChatGPT um eine schnelle Überprüfung oder Einordnung bitten.
Bildanalyse und -beschreibung: Du kannst komplexe Bilder, Kunstwerke oder Diagramme abfotografieren und ChatGPT um detaillierte Beschreibungen oder Analysen bitten.
Wenn wir ein paar Monate weiter blicken, gehe ich davon aus, dass die ChatGPT-App auf macOS/Windows zur Super-App werden wird. Heute können wir Screenshots an die App schicken, im nächsten Schritt wird die App Vollzugriff auf unseren Bildschirm haben, um selbst Aktionen ausführen zu können. Wir werden der ChatGPT-App via Text- oder Voice-Prompt eine Aufgabe übergeben, und ChatGPT wird diese Aufgabe für uns ausführen, während wir auf dem Bildschirm zuschauen.
Passend dazu hat OpenAI im Juni zwei Unternehmen übernommen: Rockset und Multi. Rockset hat sich auf Echtzeit-Analytik-Datenbanken spezialisiert, und Multi ist eine Lösung für gleichzeitiges Teilen von Bildschirmen und gemeinsame Cursor-Nutzung.
KI-Agenten, die Aufgaben für dich auf deinem Computer übernehmen, kommen vielleicht um einiges schneller als gedacht.
40% mehr Produktivität in nur 21 Tagen – Unser KI-Bootcamp macht's möglich!