Tech

Wie „KI-Agenten“, die im Internet unterwegs sind, eines Tages Arbeiter ersetzen könnten

Der weit verbreitete Chatbot ChatGPT ist für die Erstellung digitaler Texte konzipiert, von Gedichten über Forschungsarbeiten bis hin zu Computerprogrammen. Doch als ein Team von Forschern für künstliche Intelligenz beim Computerchip-Hersteller Nvidia die zugrunde liegende Technologie des Chatbots in die Hände bekam, wurde ihnen klar, dass dieser noch viel mehr leisten konnte.

Innerhalb weniger Wochen brachten sie ihm bei, Minecraft zu spielen, eines der beliebtesten Videospiele der Welt. In der digitalen Welt von Minecraft lernte ich schwimmen, Pflanzen sammeln, Schweine jagen, Gold abbauen und Häuser bauen.

„Er kann die Welt von Minecraft betreten und auf eigene Faust erkunden, selbst Materialien sammeln und sich in allen möglichen Fähigkeiten verbessern“, sagte Linxi Fan, ein leitender Forscher bei Nvidia, bekannt als Jim.

Das Projekt Dies war ein frühes Anzeichen dafür, dass die weltweit führenden KI-Forscher Chatbots in eine neue Art autonomes System namens KI-Agent verwandeln. Diese Agenten können mehr als nur chatten. Sie können Softwareanwendungen, Websites und andere Online-Tools nutzen, darunter Tabellenkalkulationen, Online-Kalender, Reise-Websites und mehr.

Mit der Zeit, sagen viele Forscher, könnten KI-Agenten viel ausgefeilter werden, Büroangestellte ersetzen und nahezu jede Verwaltungsfunktion automatisieren.

„Es ist eine riesige Geschäftsmöglichkeit, potenziell Billionen von Dollar wert“, sagte Jeff Clune, Professor für Informatik an der University of British Columbia, der zuvor als Forscher bei OpenAI, einem Start-up-Unternehmen in San Francisco, an dieser Art von Technologie gearbeitet hat Die Technologie. ChatGPT. „Das hat einen enormen Vorteil – und schwerwiegende Folgen – für die Gesellschaft.“

Nvidia-Agent spielt ein Spiel. Ähnliche Agenten können Besprechungen planen, Dateien bearbeiten, Daten analysieren und mehrfarbige Balkendiagramme erstellen. Die Idee ist, dass diese automatisierten Systeme letztendlich als persönliche Assistenten fungieren, die eine Vielzahl von Online-Aufgaben erledigen können.

Diese Technologie könnte, wenn Forscher sie verbessern, Büroangestellte und Verbraucher effizienter machen. Es könnte auch die Natur von Videospielen verändern und eine neue Welle von Bots hervorbringen, mit denen Spieler spielen und mit denen sie chatten können.

GPT-4, die Technologie, die ChatGPT antreibt, wird von Forschern als großes Sprachmodell bezeichnet. Es handelt sich um ein künstliches Intelligenzsystem, das Fähigkeiten durch die Analyse riesiger Datenmengen erlernt.

In den letzten Monaten hat diese Technologie Hunderte Millionen Menschen mit der Art und Weise begeistert, wie sie E-Mails erstellt, Reden schreibt und Lieder zu fast jedem Thema singt. Aber seine wichtigste Fähigkeit dürfte sein Talent zum Schreiben von Computerprogrammen sein.

Er kann sofort ein Programm erstellen, das ein Einhorn zeichnet oder Schneeflocken digital auf den Bildschirm seines Laptops fallen lässt. Professionelle Softwareentwickler können Code in Auftrag geben, den sie in größere Programme integrieren können, darunter alles von Social-Media-Apps bis hin zu Suchmaschinen. Aber das ist nur ein Teil dessen, was diese Technologie leisten kann. Es kann auch Computercode generieren, der in anderen Softwareanwendungen und Websites verwendet werden kann.

So brachten Dr. Fan und andere Nvidia-Forscher GPT-4 bei, wie man Minecraft spielt. „Das wichtigste Wort hier ist Code“, sagte Dr. Fan. „Code kann Maßnahmen ergreifen.“

Menschen nutzen Softwareanwendungen und Websites, indem sie Schaltflächen, Menüs und andere grafische Tools berühren. KI-Agenten nutzen Apps und Websites, indem sie auf deren Anwendungsprogrammierschnittstellen oder APIs zugreifen – den zugrunde liegenden Softwarecode, der es ihnen ermöglicht, mit anderen Onlinediensten zu kommunizieren.

Wenn Sie einen Agenten beispielsweise bitten, ein Video ins Internet hochzuladen, kann er einen von YouTube bereitgestellten Code generieren, der als Anwendungsprogrammierschnittstelle (API) bezeichnet wird. „Eine API ist nur Text, der zur Kommunikation mit einer Maschine verwendet wird“, sagte Selin Nayhin, eine Forscherin, die das AutoGPT-Projekt für autonome KI-Agenten leitet.

Siehe auch  Apple iPhone 15 Pro Leaked Renders zeigt neue Tasten

Theoretisch kann ein Chatbot Code schreiben, um auf jede API im Internet zuzugreifen. Doch die heutigen Chatbots sind nicht kompetent genug, um mehr als einfache Aufgaben zu erledigen. Selbst wenn dies der Fall wäre, wäre es ein großes Sicherheitsrisiko, wenn man ihnen erlaubt, sich im Internet frei zu bewegen. Also fingen die Unternehmen klein an.

Einige Monate nachdem OpenAI ChatGPT vorgestellt hatte, veröffentlichte es stillschweigend eine Möglichkeit für einen Chatbot, mehr zu tun als nur Text zu generieren. Nach der Installation mehrerer Plug-Ins – einer Software, die die Möglichkeiten des Bots erweitert – können Sie ihn bitten, Reiseseiten wie Expedia nach verfügbaren Flügen zu durchsuchen, eine Karte Ihrer Stadt von Google Earth abzurufen oder sogar eine Tabelle mit detaillierten Angaben zu Ihren jährlichen Ausgaben in umzuwandeln. .. Mehrfarbiges Balkendiagramm.

Da ChatGPT über ein Plugin namens Code-Compiler verfügt, kann es nicht nur Code schreiben, sondern ihn auch ausführen. Dies hat es der Technologie ermöglicht, Aufgaben, die in der Vergangenheit nicht möglich waren, sofort auszuführen, einschließlich der Bearbeitung von Tabellenkalkulationen und der Konvertierung von Standbildern in Videos. Google, Microsoft und andere Unternehmen erforschen ähnliche Technologien.

„Dies sind Projekte, bei denen wir uns vorstellen, dass KI im Wesentlichen in Ihrem Namen mit anderen KI zusammenarbeitet“, sagte Ashley Lawrence, Vizepräsidentin bei Microsoft.

Unabhängige Projekte wie AutoGPT versuchen, in dieser Hinsicht noch einen Schritt weiter zu gehen. Die Idee besteht darin, dem System Ziele wie „ein Unternehmen gründen“ oder „etwas Geld verdienen“ zu geben. Es wird dann nach Wegen suchen, dieses Ziel zu erreichen, indem es sich selbst Fragen stellt und sich mit anderen Internetdiensten verbindet.

Siehe auch  Lenovo IdeaPad Gaming 3 Laptop mit RTX 4050 und Ryzen 7 7735HS erhält den ersten nennenswerten Rabatt

Heute funktioniert das nicht mehr so ​​gut. Systeme wie AutoGPT neigen dazu, in Endlosschleifen zu stecken. Aber Forscher wie Dr. Fan arbeiten ständig daran, diese Art von Technologie zu verbessern, um sie nützlicher und zuverlässiger zu machen.

Andere Forscher entwickeln einen neuartigen Agenten für künstliche Intelligenz, der Softwaretools nutzen soll. Im Sommer 2022 war Dr. Clune Teil eines Forscherteams bei OpenAI, das einen Agenten entwickelte, der dazu in der Lage ist Benutzen Sie Computerprogramme so oft, wie es ein Mensch tun würde – Mausklick nach Mausklick, Tastendruck nach Tastendruck.

Dr. Clune und seine Kollegen versorgten das System stundenlang mit Online-Videos, die Menschen beim Spielen von Minecraft zeigten. Durch die Analyse der Art und Weise, wie Menschen Maus und Tastatur verwenden, um durch die digitale Welt von Minecraft zu navigieren, lernte das System, das Spiel selbstständig auszuführen.

Andere Unternehmen bauen, darunter ein Startup namens Adept Ähnliche Agenten Dabei werden Websites wie Wikipedia, Redfin und Craigslist sowie beliebte Office-Anwendungen von Unternehmen wie Salesforce verwendet.

Dr. Clune sagt, dass diese Art von Agent es der KI letztendlich ermöglichen wird, ein viel größeres Spektrum an Softwareanwendungen und Websites zu nutzen. Jeder werde Zugang zu einem digitalen Assistenten haben, der fast alles im Internet erledigen könne, sagte er. Das würde das Leben erleichtern, könnte aber auch unzählige Jobs ersetzen.

„Wenn KI alles kann, was wir können, dann ersetzt sie nicht nur langweilige Aufgaben“, sagte er. „Es ersetzt alle Aufgaben.“

Manni Winkler

"Bier-Geek. Der böse Ninja der Popkultur. Kaffee-Stipendiat fürs Leben. Professioneller Internet-Lehrer. Fleisch-Lehrer."

Related Articles

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Back to top button
Close
Close