Meta

Facebook veröffentlicht KI-Modell, das Objekte in Bildern identifiziert

Bilderkennung auf einem gänzlich neuen Niveau, nicht weniger verspricht die Forschungsabteilung von Facebook.

Für uns Menschen ist es die natürlichste Sache der Welt: Wir sehen ein Bild und erkennen darauf die Details und können sie identifizieren. Ein Computer "sieht" anders. Umso erstaunlicher die Mitteilung von Facebook: Die Forschungsabteilung hat ein Modell mit Hilfe Künstlicher Intelligenz entwickelt, das einzelne Objekte in einem Bild erkennen und identifizieren kann, in dem es auf einen riesigen Datensatz zurückgreifen kann. Größer als jeder andere bisher, wie die Forscher in einem Blogpost hervorheben.

Wie funktioniert's? Das "Segment Anything Model" (SAM) kann Objekte in Bildern und Videos auch dann identifizieren kann, wenn es noch gar nicht darauf trainiert wurde.

Mit SAM können Objekte ausgewählt werden, indem man auf sie klickt oder Textaufforderungen schreibt. In einer Demonstration wurde das Wort "Katze" geschrieben, woraufhin das Tool Kästchen um jede der verschiedenen Katzen auf einem Foto zeichnete.

Noch leistungsfähigere KI-Systeme

Seit der von Microsoft unterstützte Chatbot ChatGPT von OpenAI im Herbst für Furore sorgte und eine Welle von Investitionen und einen Wettlauf um die Vorherrschaft in diesem Bereich auslöste, preisen große Technologieunternehmen ihre Durchbrüche bei der künstlichen Intelligenz an.

„SAM kann zu einer leistungsstarken Komponente in Bereichen wie AR/VR, Inhaltserstellung, wissenschaftlichen Bereichen und allgemeineren KI-Systemen werden“, sagen die KI-Forscher von Meta. „Wenn wir in die Zukunft blicken, sehen wir eine engere Kopplung zwischen dem Verständnis von Bildern auf Pixelebene und dem semantischen Verständnis visueller Inhalte auf höherer Ebene, wodurch noch leistungsfähigere KI-Systeme erschlossen werden.“

Nicht das einzige KI-Eisen im Feuer

Meta hat mehrere Funktionen angeteasert, die die von ChatGPT populär gemachte generative KI einsetzen, die brandneue Inhalte erstellt, anstatt einfach nur Daten zu identifizieren oder zu kategorisieren wie andere KI, obwohl es noch kein Produkt veröffentlicht hat.

Zu den Beispielen gehören ein Tool, das aus Textvorgaben surrealistische Videos erstellt, und ein anderes, das aus Prosa Kinderbuchillustrationen generiert.

Der Vorstandsvorsitzende Mark Zuckerberg hat erklärt, dass die Integration solcher generativen KI-"Kreativitätshilfen" in die Anwendungen von Meta in diesem Jahr eine Priorität ist.

Meta verwendet intern bereits eine SAM-ähnliche Technologie für Aktivitäten wie die Kennzeichnung von Fotos, die Moderation verbotener Inhalte und die Bestimmung, welche Beiträge den Nutzern von Facebook und Instagram empfohlen werden sollen.

Das Unternehmen sagte, dass die Freigabe von SAM den Zugang zu dieser Art von Technologie erweitern würde.

Das SAM-Modell und der Datensatz werden unter einer nicht-kommerziellen Lizenz zum Download zur Verfügung stehen. Nutzer, die ihre eigenen Bilder in einen begleitenden Prototyp hochladen, müssen sich ebenfalls verpflichten, diese nur für Forschungszwecke zu verwenden.

>>> Segment-Anything

(bagre)

Lesen Sie mehr zu diesen Themen:


Dieser Browser wird nicht mehr unterstützt
Bitte wechseln Sie zu einem unterstützten Browser wie Chrome, Firefox, Safari oder Edge.