
Microsoft weiß, dass Maus und Tastatur zwei Nachrichten sein können. Die PCs und Laptops machen immer noch Sinn, möchten sie jedoch mit einer Version von Windows vorbereiten, die an das angepasst ist, was kommt. Und was kommt, ist KI und Stimme. Sie beginnen also und sie haben bereits ihre besondere Vision, wie Fenster im Jahr 2030 aussehen werden.
Von Maus und Tastatur, (wenig O) Nichts. «Die Welt der Mäuse und Keyboards wird für Menschen so seltsam sein wie für die Generation Z». Diese Stumpf war David Weston, Direktor von Microsoft, In einem Video, das diese Woche veröffentlicht wurde von der Firma mit dem Titel «2030 Vision» (so etwas wie «unsere Vision, wie 2030»). Dieser Manager erklärte, dass das Windows -Betriebssystem wahrscheinlich sehr unterschiedlich sein wird, die wir jetzt haben. Zumindest in seiner Benutzeroberfläche.
Multimodal oder was ist gleich: Stimme. Weston betonte auch, wie «die zukünftige Version von Windows auf multimodale Weise interagieren wird. Der Computer kann sehen, was wir sehen, hören, was wir hören, und wir können mit ihm sprechen und um viel raffiniertere Dinge bitten». Die Sprachinteraktion wird zweifellos einer der Tasten sein, und obwohl die Maus und die Tastatur weiterhin relevant sind, ist der Fortschritt wahrscheinlich klar: Wir werden sie weniger verwenden, denn wir werden einfach darin bestehen, Windows -Dinge zu fragen.
Maschine, mach das für mich. Einerseits können wir also nach einfachen Dingen wie «die Auflösung auf 1920×1080 ändern», «Open Slack», «Schreiben Sie eine E -Mail mit dem folgenden Text» und für eine weitere komplexere Dinge wie «organisiert ein Wochenende in Salamanca und reservieren Sie die Hotels und reservieren Sie nach meiner Bestätigung» oder «Erstellen Sie eine Präsentation mit Canva mit der Daten zu restaurieren.» In diesen Anfragen gibt es wahrscheinlich Momente, in denen der Benutzer weiterhin eingreifen, um Aufgaben innerhalb der Sequenz zu korrigieren oder zu bestätigen, die das System autonom ausführt.
Ein landwirtschaftlicher Fenster. Und es ist so, dass die Schlüsselkomponente dieser zukünftigen Fenster eine landwirtschaftliche KI sein wird, die Aufgaben autonom verkettet, um Prozesse zu vervollständigen, die ein Benutzer verlangt. Die AI -Agenten zeigen bereits ihr Potenzial in dieser Hinsicht, und wir haben gesehen, dass sowohl diejenigen, die im Verwirrigkeitsbrowser als auch im Chatgpt -Agenten anwesend sind, sehen können, was wir auf dem Bildschirm sehen, und entsprechend zu handeln, indem wir die Maus bewegen oder bei Bedarf eintippen. Sie übertreffen sogar einige Captchas, wenn sie es brauchen!
Eine machbare, aber ungewisse Vision. Der Fortschritt der KI ist verzweifelt, aber KI -Agenten erfüllen nicht die Erwartungen und entsprechen nach einigen Studien in 70% der Aufgaben. Bei dieser Art von automatisierten Prozessen besteht die Gefahr auch der des zusammengesetzten Fehlers: Wenn ein Fehler in einem von ihnen ein Fehler enthält, wird dieser Fehler in jeder nächsten Phase größer. Die Risiken sind in allen Arten von Szenarien enorm, aber noch mehr, wenn Benutzer diese Kapazität für empfindliche Aufgaben mit sensiblen Daten des Typs «Make Me the Enconomy Statement» verwenden.
Nadella warnte es bereits. Vor mehr als einem Jahr wies Satya Nadella, CEO von Microsoft, bereits auf diese Zukunft hin. Er tat es, als er in den Snapdragon Summit 2023 intervenierte, wo sagte Das «Es wird radikal ändern, was ein Betriebssystem ist, der Aspekt einer Benutzeroberfläche und wie es mit Anwendungen interagiert».
Die Browser drohen. Wir beginnen bereits, diese landwirtschaftliche Interaktion zu sehen, die oft das Zentrum unserer Erfahrung mit PCs und Laptops ist, und dass sie diese Automatisierungsfunktionen nach und nach in die KI -Agenten integrieren. Sowohl der Chatgpt -Agent als auch der Verwirrungskomet zeigen es, und Google bereitet sich auch darauf vor, in Chrome etwas Ähnliches zu tun. Es wird erwartet, dass in Microsoft Sie bewerben sich auch Die Geschichte mit Edge, die lange integrierte Copilot. Die Vision von Microsoft ist jedoch breiter und beeinflusst das gesamte Betriebssystem, nicht nur den Browser.
Bild | Microsoft
In | Das GPT-5-Paradox: Openai braucht den größten Sprung in der Geschichte der KI, wenn es am unmöglichsten erscheint

