Googles neueste I/O-Konferenz war ein regelrechter Schwall an KI-Versprechen. Das Unternehmen nahm so viele Versuche mit neuen KI-Modellen, angeben neue KI Fähigkeiten die Gemini in jedes einzelne Google-Produkt oder jeden Dienst unter der Sonne integrieren. Aber machen Sie genügend Fotos, und das Gesetz der Durchschnitte besagt, dass mindestens ein Foto ins Ziel trifft. Mit der Gemini-KI könnte die kommende Funktion „Ask Photos“ das Eintauchen in das Labyrinth der Alben in Google Fotos erheblich einfacher machen.
Wie Alphabet-CEO Sundar Pichai bei der jährlichen Präsentation seines Unternehmens ausführlich erläuterte, würde diese Funktion im Wesentlichen KI nutzen, um Ihre riesigen Fotoalben für Sie zu durchsuchen. Sie können mithilfe von Schlüsselwörtern versuchen, sich durch möglicherweise jahrelange Bilder, Fotos und Memes zu wühlen, um das eine Bild zu finden, das Sie brauchen. Google behauptete, dass das Gemini-Modell von Google mit einer einzigen Eingabeaufforderung Ihre Fotos präziser durchsuchen würde als bei Ihren üblichen Abfragen nach der Nadel im Heuhaufen.

Die Gemini-KI in Ask Photos kann Bilder interpretieren und darin enthaltenen Text lesen. Wenn Sie beispielsweise in einer Menge von Autobildern in Ihrer Fotos-App nach dem Nummernschild Ihres Autos suchen, kann die KI anhand der Häufigkeit, mit der das Auto in Ihren Alben auftaucht und des Kontexts, viel besser erkennen, welches Ihr Fahrzeug ist. Pichai sagte, dass Ask Photos so gut sei, dass es anhand Ihrer Bilder sogar Lebensereignisse interpretieren könne, z. B. Ihnen sagen könne, wann Ihre Tochter schwimmen gelernt habe.
In einem BlogbeitragJeremy Selier, Entwickler bei Google Photos, sagte, dass es auf der bestehenden KI-Schlüsselwortfunktion aufbaut, die bereits seit einiger Zeit in der App vorhanden ist. Anstatt sich die richtigen Schlüsselwörter ausdenken zu müssen, werden Ihnen durch einfaches Abfragen aller in einem Nationalpark aufgenommenen Fotos auf Ihrem Telefon alle relevanten Fotos angezeigt. Außerdem erhalten Sie eine Übersicht darüber, welche Parks Sie besucht haben.
Die KI sollte auch in der Lage sein, die Fotos zu verstehen, die Sie im Laufe der Jahre aufgenommen haben. In einem Beispiel könnte die KI die verschiedenen Themen der im Laufe der Jahre gefeierten Kindergeburtstage erklären. Selier hat geschrieben, dass die KI im Wesentlichen die richtigen Schlüsselwörter für Sie heraussucht, bevor sie mit der Suche in Ihren Fotos beginnt.
Obwohl die Demos ziemlich gut aussahen, handelt es sich dennoch um KI, und KI neigt dazu, Dinge falsch zu machen. Das Unternehmen sagte, dass Ask Photos „experimentell“ sei, der Spitzname, den Google so ziemlich allen seinen KI-Projekten gibt, egal, in welchem Zustand sie sich befinden. Selier sagte, Ask Photos werde sich die Korrekturen, die Sie in Zukunft vornehmen, merken, aber das bedeute nicht, dass ihm bei einer anderen Eingabeaufforderung nicht der eine oder andere Fehler unterlaufen könne.
Die Funktion sollte „in den kommenden Monaten“ verfügbar sein, obwohl dies ein eher vager Zeitrahmen ist, der zu den übrigen nebulösen KI-Ankündigungen von Google bei der diesjährigen I/O passt. Zumindest scheint Ask Photos weitaus nützlicher zu sein als ein früher KI-Videogenerator oder noch mehr die Gemini-Integration in Google Workspace.