115 Seeing AI
Das schweizer Taschenmesser für Blinde
03.06.2026 39 min
Zusammenfassung & Show Notes
Dein Ansprechpartner für Digitale Kompetenz und mehr Selbstbestimmtheit als Blinder Mensch!
Hier sind wir: https://schulze-graben.de
Hier sind wir: https://schulze-graben.de
**Seeing AI – das Schweizer Taschenmesser für Blinde: Microsofts kostenlose KI-App im großen Live-Test auf dem iPhone | SmüTech**
In dieser praxisnahen SmüTech-Episode (Aufzeichnung der Montagsveranstaltung) zeigt Joachim Schulze (Jockl), JAWS-zertifizierter IT-Trainer für Blinde und Sehbehinderte, warum **Seeing AI** von Microsoft seit 2020 eine der stärksten und beliebtesten Barrierefreiheits-Apps ist. Viele nennen sie das echte **Schweizer Taschenmesser** unter den KI-Tools für Blinde – und nach diesem Live-Test verstehst du sofort, warum.
Jockl öffnet die App live auf dem iPhone und demonstriert, wie sie dir den Alltag wirklich erleichtert – ohne teure Spezialgeräte. Du erlebst hautnah:
- **Echtzeit-Display-Lesen (on the fly)**: Touchscreens von Druckern, Geräten oder Kassen sofort vorlesen. Buttons wie „Reset“, „Copy“, „Scan“ oder ganze Menüs (inkl. Fax-Einrichtung) werden erkannt, sobald die Kamera drübergeht. Ein Feature, das seit Jahren begeistert und dir echte Unabhängigkeit schenkt.
- **Dokumentenscannen auf hohem Niveau**: Auch Querformat-Dokumente und mehrseitige Anleitungen werden zuverlässig erfasst. Live-Demo mit einer „fiesen“ Betriebsanleitung und dem farbenfrohen Flyer vom **Ferienlager Schloss Thurn 2026** (mit Terminen, Illustrationen und QR-Code) – inklusive Text-Extraktion und Foto-Untersuchung.
- **Foto & Szenenbeschreibung mit KI-Power**: Microsofts GPT-basierte KI beschreibt Bilder detailliert (z. B. Selbstporträt am Fenster oder Parkplatz-Aussicht mit Autos und Wohnmobil). Besonders stark: Die **Foto-Untersuchen-Funktion** – einfach mit dem Finger über den Bildschirm wischen und Objekte, Texte und deren Positionen erkunden („9 Elemente erkannt“).
- **Personen & Objekte trainieren**: Bring der App bei, wer deine Familie oder Freunde sind – oder wo dein Schlüsselbund liegt. Später erkennt sie sie zuverlässig wieder.
- **Weitere starke Features**: Währungserkennung, Farberkennung (über Foto), Barcode-Scanning, Objekterkennung und vieles mehr – alles kostenlos in einer App.
Jockl ist ehrlich: Seeing AI ist unschlagbar bei schneller Display-Orientierung und der einzigartigen Foto-Exploration per Finger. Im Vergleich zu **Be My AI** (Be My Eyes) hat es klare Stärken – und klare Grenzen. Er erklärt, warum es heute **keine eine App für alles** mehr gibt und wie du smarte Tool-Kombinationen für maximale Selbstständigkeit und digitale Kompetenz findest.
Ob du schon Seeing AI nutzt oder gerade einsteigen willst: Diese Folge ist voll mit konkreten Tipps, Live-Demos und ehrlichen Erfahrungen aus über 5 Jahren Nutzung. Perfekt für Blinde, Sehbehinderte, Angehörige und alle, die Barrierefreiheit am iPhone mit VoiceOver wirklich verstehen und nutzen möchten.
### Seeing AI jetzt kostenlos herunterladen:
**iPhone / iPad (deutscher App Store):**
https://apps.apple.com/de/app/seeing-ai/id999062298
**Android (deutscher Google Play Store):**
https://play.google.com/store/apps/details?id=com.microsoft.seeingai&hl=de&gl=DE
**Hört jetzt rein und macht euren Alltag ein Stück selbstständiger!**
Gefällt euch die Episode? Dann gebt gerne einen Like, teilt sie mit Freunden oder Familie und abonniert SmüTech für wöchentliche kostenlose Tipps zu iPhone, VoiceOver, JAWS, KI-Apps und echter Barrierefreiheit.
Unterstützt die Arbeit von Jockl mit einer kleinen Geste:
**https://danke.schulze-graben.de**
#SeeingAI #MicrosoftSeeingAI #AppFürBlinde #Sehbehinderte #Barrierefreiheit #iPhoneApps #Dokumentenscannen #FotoUntersuchen #Objekterkennung #KI #SmüTech #JoachimSchulze #Jockl
In dieser praxisnahen SmüTech-Episode (Aufzeichnung der Montagsveranstaltung) zeigt Joachim Schulze (Jockl), JAWS-zertifizierter IT-Trainer für Blinde und Sehbehinderte, warum **Seeing AI** von Microsoft seit 2020 eine der stärksten und beliebtesten Barrierefreiheits-Apps ist. Viele nennen sie das echte **Schweizer Taschenmesser** unter den KI-Tools für Blinde – und nach diesem Live-Test verstehst du sofort, warum.
Jockl öffnet die App live auf dem iPhone und demonstriert, wie sie dir den Alltag wirklich erleichtert – ohne teure Spezialgeräte. Du erlebst hautnah:
- **Echtzeit-Display-Lesen (on the fly)**: Touchscreens von Druckern, Geräten oder Kassen sofort vorlesen. Buttons wie „Reset“, „Copy“, „Scan“ oder ganze Menüs (inkl. Fax-Einrichtung) werden erkannt, sobald die Kamera drübergeht. Ein Feature, das seit Jahren begeistert und dir echte Unabhängigkeit schenkt.
- **Dokumentenscannen auf hohem Niveau**: Auch Querformat-Dokumente und mehrseitige Anleitungen werden zuverlässig erfasst. Live-Demo mit einer „fiesen“ Betriebsanleitung und dem farbenfrohen Flyer vom **Ferienlager Schloss Thurn 2026** (mit Terminen, Illustrationen und QR-Code) – inklusive Text-Extraktion und Foto-Untersuchung.
- **Foto & Szenenbeschreibung mit KI-Power**: Microsofts GPT-basierte KI beschreibt Bilder detailliert (z. B. Selbstporträt am Fenster oder Parkplatz-Aussicht mit Autos und Wohnmobil). Besonders stark: Die **Foto-Untersuchen-Funktion** – einfach mit dem Finger über den Bildschirm wischen und Objekte, Texte und deren Positionen erkunden („9 Elemente erkannt“).
- **Personen & Objekte trainieren**: Bring der App bei, wer deine Familie oder Freunde sind – oder wo dein Schlüsselbund liegt. Später erkennt sie sie zuverlässig wieder.
- **Weitere starke Features**: Währungserkennung, Farberkennung (über Foto), Barcode-Scanning, Objekterkennung und vieles mehr – alles kostenlos in einer App.
Jockl ist ehrlich: Seeing AI ist unschlagbar bei schneller Display-Orientierung und der einzigartigen Foto-Exploration per Finger. Im Vergleich zu **Be My AI** (Be My Eyes) hat es klare Stärken – und klare Grenzen. Er erklärt, warum es heute **keine eine App für alles** mehr gibt und wie du smarte Tool-Kombinationen für maximale Selbstständigkeit und digitale Kompetenz findest.
Ob du schon Seeing AI nutzt oder gerade einsteigen willst: Diese Folge ist voll mit konkreten Tipps, Live-Demos und ehrlichen Erfahrungen aus über 5 Jahren Nutzung. Perfekt für Blinde, Sehbehinderte, Angehörige und alle, die Barrierefreiheit am iPhone mit VoiceOver wirklich verstehen und nutzen möchten.
### Seeing AI jetzt kostenlos herunterladen:
**iPhone / iPad (deutscher App Store):**
https://apps.apple.com/de/app/seeing-ai/id999062298
**Android (deutscher Google Play Store):**
https://play.google.com/store/apps/details?id=com.microsoft.seeingai&hl=de&gl=DE
**Hört jetzt rein und macht euren Alltag ein Stück selbstständiger!**
Gefällt euch die Episode? Dann gebt gerne einen Like, teilt sie mit Freunden oder Familie und abonniert SmüTech für wöchentliche kostenlose Tipps zu iPhone, VoiceOver, JAWS, KI-Apps und echter Barrierefreiheit.
Unterstützt die Arbeit von Jockl mit einer kleinen Geste:
**https://danke.schulze-graben.de**
#SeeingAI #MicrosoftSeeingAI #AppFürBlinde #Sehbehinderte #Barrierefreiheit #iPhoneApps #Dokumentenscannen #FotoUntersuchen #Objekterkennung #KI #SmüTech #JoachimSchulze #Jockl
Schön, dass du dabei bist.
Wenn du Heute was mitgenommen hast, dann gib doch etwas zurück.
Das ist ganz einfach. Besuche https://danke.schulze-graben.de und zeig mir, ob dir die Show gefallen hat.
Kleine Gesten machen den Unterschied.
Wenn du Heute was mitgenommen hast, dann gib doch etwas zurück.
Das ist ganz einfach. Besuche https://danke.schulze-graben.de und zeig mir, ob dir die Show gefallen hat.
Kleine Gesten machen den Unterschied.
Transkript
Neues, das ist wunderbar.
Jaws Certified, IT-Trainer für Blinde und Sehbehinderte.
Und ich darf wieder einen wunderschönen guten Montag wünschen.
Vielen Dank, dass ihr euch alle wieder die Zeit heute genommen habt
für eine weitere Montagsveranstaltung hier auf dem Schulzefunk.
Und alle anderen, die dann am Mittwoch oder irgendwann danach
über die Podcast-Folge im SmüTek stolpern,
freue ich mich natürlich mindestens genauso.
Und ja, jeder, der die heutige Veranstaltung mitnimmt,
der gibt sich wieder ein Stück digitale Kompetenz.
Und das Beste ist, das kostet nichts.
Denn diese Veranstaltung zeigt euch wie jede Montagsveranstaltung
wieder ein tolles Thema.
Und heute geht es um BIMA, äh, CIN AI,
das Schweizer Taschenmesser für Blinde.
Ja, CIN AI, BIMA AIs, da kommt man schon langsam durcheinander
mit den ganzen Apps, und wie sie nicht alle heißen,
nächste Woche haben wir schon wieder eine im Programm.
Mein Gott, da ist was los im Juni.
Aber heute geht es uns um CIN AI.
Und wenn es um CIN AI geht,
dann bin ich immer ein bisschen emotional.
Nicht weil es wie BIMA AIs eine App war,
die mir in einer wirklich anspruchsvollen Lebensphase
öfter mal den Allerwertesten gerettet hat,
sondern weil CIN AI die erste wirkliche Barrierefreiheits-App
von Microsoft war.
Und Microsoft hat damals ganz klar gesagt,
hey, wir wollen eine kostenlose App schaffen,
die blinden das Leben leichter macht.
Okay, und das ist erst mal eine Ansage.
Da kann man sagen, haben Sie das geschafft
oder ist das komplett in die Hosen gegangen?
Ganz ehrlich, da hat Microsoft
einen ziemlich ordentlichen Job hingelegt.
Und das ist ja schon eine ganze Weile her.
Denn tatsächlich gibt es Be My Eyes seit 2016
und Cine AI kam bald danach, nämlich im Jahr 2020.
Ja, und da war dann schon langsam so der Punkt erreicht.
Also 2020 war so der große Durchbruch dann im Endeffekt.
Wir hatten auch schon 2018 erste Testversionen
und tatsächlich konnte man damals schon was machen,
was eigentlich sonst nur mit menschlicher Hilfe möglich war,
nämlich Displays lesen. Moment!
Eine App, mit der man wirklich Displays lesen kann,
ja, das funktioniert mit Cine AI.
Und das Krasse ist, in der Standardansicht,
nur wenn ich die App aufmache, dann funktioniert das on the fly.
Das heißt, wenn ich irgendwo drauf klicke und sich das Display verändert,
dann reagiert diese App.
Und mal ganz ehrlich, das jetzt schon so viele Jahre,
das ist schon ein richtig cooles Feature, das total Spaß macht
und dass das Leben bedeutend erleichtert.
Das muss man einfach mal so sagen, wie es ist.
Und Microsoft hat dann irgendwann gesagt,
okay, also das klappt jetzt ganz gut, dass wir,
wenn man mit der Kamera drüber geht, Texte erkennen können,
vielleicht auch mal Display einigermaßen sauber kriegen.
Aber da wollen wir gerne mehr.
Und wenn wir schon mehr wollen, dann packen wir doch eine Farberkennung rein.
Okay, eine Farberkennung?
Also das sind doch normalerweise Geräte, die kosten 300, 400 Euro.
Ja, Microsoft hat das einfach mal in eine kostenlose App gepackt.
Und ganz ehrlich, wie schlecht ist die?
Das werden wir heute rausfinden.
Und ich kann euch jetzt schon sagen, viel weniger schlecht als man glauben möchte,
dafür, dass sie nichts kostet.
Ja, und dann gibt es natürlich jede Menge mehr Features,
die man einfach so in dieses Ding reingepackt hat.
Und wenn man das dann alles zusammen nimmt, dann kommt da am Ende ein Gesamtpaket raus,
wo ich ehrlich sagen muss, boah, das macht richtig Spaß.
Ja, und wie das alles aussieht,
das wollen wir uns jetzt dann heute mal zusammen angucken auf dem iPhone.
Und ja, ich werde nicht alle Funktionen abdecken können.
Das sage ich auch wieder mal gleich dazu, denn dafür sind es einfach zu viele.
Also es ist inzwischen wirklich so, es gibt einige Funktionen, die sind unschlagbar bei Cine AI.
Aber tatsächlich ist das nicht alles, was die App drauf hat,
denn sie kann viel, viel mehr.
Und ja, ein bisschen von dem, was sie so alles kann,
das wollen wir uns anschauen.
Zum Beispiel hat sie auch eine Möglichkeit,
das hat Apple auch versucht, ein bisschen reinzukriegen,
nämlich eine Szenenbeschreibung.
Man kann Objekte finden und, und, und, und, und.
Also alles, das sind so Sachen.
Ja, das ist schon richtig, richtig cool.
Und wir haben vorher schon mal den Namen Microsoft gehört.
Und der muss in diesem Zusammenhang auch immer wieder erwähnt werden.
Denn was können wir schließen aus der Tatsache,
dass da Microsoft mit drin steckt?
Ganz klar, das Ding ist natürlich voller KI.
Und da hat sich Microsoft auch echt nicht lummen lassen.
Ja, und dann probieren wir das doch jetzt einfach mal und machen die App auf.
So, dazu sage ich Siri wieder einmal.
Öffne die App Be My Eyes.
Okay, Taste.
Nein, du sollst nicht Be My Eyes öffnen, du sollst Seeing AI öffnen.
App um Schalter, Be My Eyes, Be My Eyes, Kilo, App um Schalter, Doc, Chrome.
Öffne die App Seeing AI.
Seeing AI, Menü, Taste.
Ihr werdet es heute öfter erleben, dass ich zwischendrin die beiden Namen einfach mal vermische.
O, U, U, Brigado, U, U, C, B, 0, 0, 0, 3, 0, 0, Friede, 1, 0, 0, Code.
Jetzt muss ich gleich hier wieder gegensteuern.
100 plus, 100 plus, Rechtszahl, Detlef, D5.
So, muss ich gleich zwischen funken.
Denn sobald ich die App aufmache, fängt der vor zu lesen an alles, was in Reichweite der Kamera ist.
Und das war jetzt hier eben die Beschriftung Focus 40, meiner Breitzeile und so weiter und so fort.
Und das muss man einfach klar sehen.
Sobald ich mich orientieren will, auch was liegt worum, wo steht was drauf, ist diese Standardansicht einfach unschlagbar.
So, und jetzt machen wir mal was.
Das ist mein Drucker hier, ein HP Laserjet und den erwecken wir jetzt mal zum Leben.
Wir lassen ihn hier loslegen, ich berühre einmal das Touch-Display und halte auch nur
die Kamera hin.
So, und er sagt mir hier sofort alles an, reset, bereit, copy und scannen.
Das sind nämlich die zwei Funktionen, die hier als große Buttons auftreten auf dem
Display.
Und ganz ehrlich, wie cool ist das denn?
Ja, ich mein, so muss das laufen, finde ich einfach toll.
So zeigt er jetzt immer noch an, sobald ich die Kamera ein bisschen bewege, sagt das neu
an.
So, wenn ich jetzt hier zum Beispiel auf einen draufgehe, so, ich habe jetzt auf Fax geklickt
und er sagt mir ganz klar, es ist nicht konfiguriert, soll es jetzt eingerichtet werden.
Ja, nein.
Krass.
Oder?
Ich könnte jetzt hier einmal auf Ja klicken.
So.
Er liest es nicht ganz sauber vor, er ist jetzt im Faxmenü und er zeigt mir den Ziffernblock
an.
Ich mache jetzt mal kurz die Sprachausgabe aus vom iPhone, damit man da hier nicht durcheinander
kommt.
Ihr seht schon, das ist gigantisch.
Ich kann mich auf einem Display mehr oder weniger orientieren, obwohl ich nichts sehe.
Also ganz ehrlich, wie cool ist das denn?
So.
Und jetzt machen wir mal weiter.
Jetzt gucken wir mal, wie das mit dem Dokumente scannen funktioniert.
Das kann das Ding nämlich auch.
Das habe ich schon mal gezeigt in einer Montagsveranstaltung, aber weil es ja sonst langweilig wäre, zeige
ich das heute noch mal und habe hier was richtig fieses, nämlich eine Betriebsanleitung von
meinem Blutdruckmessgerät und zwar im Querformat, so meine Lieben.
Und das ist jetzt richtig fies, weil klar, aufrecht die Kamera drüber halten, das kriege
ich schon noch so irgendwie hin, aber im Querformat und dann gucken, ob ich sauber das Dokument
abgescannt kriege, das ist dann schon nochmal eine andere Hausnummer und das wollen wir
jetzt zusammen ausprobieren, ich schalte hier wieder die Sprachausgabe ein, ich habe nichts
verändert ansonsten am Beamer Ice, wir hatten früher immer so ein Trinkspiel, das war immer
bei den Harry Potter Büchern, jedes Mal wenn jemand Harry sagt, muss man einen Shot trinken,
das machen wir heute Abend nicht, sonst hat diese Veranstaltung nicht viel Wert, nein
bei 7 AI. Wenn ich jetzt ihn erstmal einfach mit der Kamera das Ding hier erkennen lasse.
Wir klappen mal auf, so nicht erschrecken, er quakt halt immer weiter, das heißt ich
halte ihn jetzt noch mal drüber, das ist noch nicht deutsch, ich lasse ihn wieder
erkennen. Wir gehen hier ein bisschen vor, bis dann mal die niederländischen Sachen
hoffentlich vorbei sind und wir mal deutsch haben. Er erkennt, was auch immer es für
die Sprache ist. Das ist ganz toll, dass es französisch ist.
Das ganze ist jetzt hier auf Englisch. Ich hatte die Hoffnung, das Ding hat ein
deutsches Manual auch, aber da werde ich jetzt gerade enttäuscht. Dann machen wir das anders,
das ist aber auch kein Problem. Tatsächlich liegt das ein bisschen daran, dass ich so unglaublich
wenig noch wirklich mit Papier zu tun habe. Das ist aber auch kein Problem, denn wir gucken
hier einfach mal schnell nach etwas anderem. Wir haben hier nämlich auch noch einen Flyer und den
können wir genauso nehmen und halten da im Endeffekt noch mal die Kamera drüber und dann kriegen
wir das angesagt. Das ist der Flyer vom Ferienlager Schloss Thurn 2026. Ich kann es leider jetzt nicht
lauter machen, das Problem ist ein bisschen, ihr versteht es wahrscheinlich nicht ganz top,
aber mein Problem ist hier, ich muss ein bisschen mit dem Lavalier Mikrofon rangieren. Ich aktiviere
jetzt die Dokumentenerkennung. Genau jetzt. Rand oben nicht sichtbar, das heißt ein bisschen
höher halten, ein bisschen nach links. Zurück. Taste. Seite eins von eins. Überschrift. Seite
hinzufügen. Taste. Mehr. Taste. 2. bis 7. August 2026 und 9. bis 14. August 2026. Ich. 2026.
Ferienlager Schloss Thurn. Torstern. L7. Wilder. Westen. Saloon. Muss. Ferienlager Schloss
Thurn. De. Symbolleiste. Freigeben. Taste. So. Und das ist hier eigentlich ziemlich tricky,
weil das ist ein Flyer. Da ist noch ein Bild drauf. Das erkennt er natürlich jetzt hier nicht. Das
Ding ist ziemlich glänzend illustriert und er hat uns trotzdem alle wichtigen Infos rausgezogen. Wir
können jetzt das Foto extrahieren oder wir könnten jetzt einfach sagen unter dem Punkt Freigeben. Wir
wollen den Text extrahieren und wir könnten Seiten hinzufügen. So. Das ist erstmal ein Punkt wo ich
persönlich sage okay, da fängt das Ding an richtig Spaß zu machen. Weil da muss man einfach sagen okay,
da kann man wirklich was damit machen. Da kann man auch mal Bücher scannen, da kann man auch mal
mehrseitige Briefe durchgehen und und und und und das ist alles kein Problem. Und wir gehen hier
einfach wieder zurück und sind hier schon wieder am Menü. Wichtig ist wir haben hier unten auch
Tabs und da haben wir den Tab Lesen, da sind wir jetzt Beschreibung Tab 2 von 3, dann haben wir
Beschreibung mehr Tab 3 von 3 und mehr und dann gehen wir mal hier auf Beschreibung Beschreibung
Tabs und dann haben wir hier auch wieder ganz viele Funktionen Gesichtserkennung, Taste,
Gesichtserkennung, Foto aufnehmen, Taste, Foto aufnehmen. Jawoll und da sind wir doch jetzt schon
wieder beim Thema. Wir haben uns ja jetzt den Text schon zugänglich gemacht. Dann machen wir
doch mal ein Foto von eben diesem jenen Flyer und lassen uns das einfach mal beschreiben.
Foto aufnehmen, ich klicke drauf. Das Bild zeigt eine hölzerne Oberfläche mit einer
farbenfrohen Broschüre, die kopfüber platziert ist. Die Broschüre enthält verschiedene
Illustrationen und Texte, darunter die Worte Freilander, Schloss Thurn und 2026 prominent
dargestellt. Unten rechts in der Broschüre befindet sich ein QR-Code. Sehr gut und wir haben
hier schon mal das wichtigste kapiert. Jockl hat das Ding wieder mal verkehrt rum. Das kann
ich besonders gut. Das ist kein Problem. Ich habe es jetzt umgedreht. Gehe hier nochmal auf Zurück.
Gehe hier nochmal auf Foto aufnehmen. Doppeltipp. Das Bild zeigt eine Broschüre oder einen Flyer,
der teilweise auf einer Holzoberfläche platziert ist. Der sichtbare Teil der Broschüre ist farbenfroh
und zeigt verschiedene Kritzeleien. Darunter Noten, einen Rollschuh, eine Leiter, einen Burger
und kartonartige Figuren. Genau, das ist genau das, was ich vorher erwähnt habe, mit den
Illustrationen. Da habt ihr sie jetzt alle. Also einfach nur cool. Ich kann mir da mal
eben schnell ein Bild machen und ihr habt es jetzt gesehen, das geht fix. Klar, geht
bei Be My Eyes mit der künstlichen Intelligenz, Be My AI auch. Und ganz ehrlich, das ist super,
aber was ist bei Seeing AI ein bisschen anders? Man sieht einfach, da steckt die Microsoft
AI, also letztlich GPT dahinter. Und das Ding ist ziemlich gut geschliffen auf das,
was mich als Blinder wirklich interessiert. Eben zum Beispiel, das Ding steht Kopf über
oder auf dem Kopf. So, das ist für mich das, was wichtig ist. Zum Beispiel, wenn ich irgendein
Dokument habe, das ich lochen muss, dann bringt mir das nichts, wenn ich das Kopf über einhefte,
weil der nächste Sehende, der das anguckt, denkt sich, ok, also entweder er hat zu oft
Harry gesagt, da sind wir dann wieder beim Trinkspielen oder er ist einfach dämlich.
Nein, er ist blind, Ausrufezeichen, aber da sind wir jetzt halt wieder bei dem Punkt,
wo mir dann so eine App richtig helfen kann, weil ich kann das alles selber machen, ich
kann mein Zeug selber abheften und das ist schon unglaublich viel wert, weil ich eben
so viel Werkzeuge in einer App vereint habe, die im Endeffekt ganz unterschiedliche Bedürfnisse
bedienen können. Und das ist jetzt wieder das Thema hier mit dem Fotos erkennen. Ja,
da muss man natürlich immer gucken, ein bisschen muss man schon auch seine Handykamera im Griff
haben. Wenn ich jetzt so einen Flyer habe, wie den hier, dann muss ich natürlich auch
gucken, dass ich meine Kamera im Querformat halte, dass im Endeffekt der Flyer richtig
drauf kommt. Das bringt jetzt nichts, wenn ich das so die Kamera im Hochformat über
den Flyer halte, der im Querformat ist, das bringt nichts. Also da muss man auch ein
bisschen ausprobieren, ein bisschen gucken, was richtig ist, aber auch das kann man recht
gut mit dieser App machen. So und jetzt ist hier noch wichtig, wenn wir ganz unten gucken,
nachdem das Bild ja erkannt wurde. Da habe ich eben das Freigeben. Kann ich auch wieder das
Foto freigeben oder die Erklärung? Ich kann jetzt hier auch noch auf Foto untersuchen gehen.
Foto speichern kann ich auch noch. So und jetzt wird es interessant. Jetzt habe ich nämlich eine
Auswahl. Die Namen von Objekten werden genannt, sobald ihr Finger darüber
streicht. So, da kann ich jetzt mir nämlich eine Vorstellung machen, was auf diesem Ding ist wo.
Untersuchen Sie die Elemente im Foto, indem Sie einen Finger über den Bildschirm, die Objekterkennung
ist nicht immer korrekt. Helfen Sie uns dabei, sie zu verbessern. Seeing eye erkennt auch Text im Bild.
Wenn Sie feststellen, dass zu viel Text vorhanden ist, können Sie zur reinen Erkennung von Objekten
und Personen wechseln. Untersuchen Sie die Elemente im Fertig-Taste. Zurück-Taste. Textblöcke
ausblenden. Taste. So und jetzt kann ich mich über den Bildschirm bewegen. Neun Elemente
erkannt. Zum Erkunden bewegen Sie den Finger über den Bildschirm. Zweiter bis siebter
August 2026. Und neunter bis vierzehnte August 2026. Ein rotes Schild mit weißem Text und
einem weißen Dreieck enthält Text. 2026. Ferienlager. Schlosstouren. So, das heißt, ich habe jetzt
hier nach unten gewischt im Endeffekt. Habe also oben die beiden Wochen, wo das stattfindet
und drunter eben dieses Dreieck mit dem Text Ferienlager. Schlosstouren. Boah Leute, wisst
ihr eigentlich wie cool das ist? Ich kann mir jetzt von einem Foto ein richtiges Bild machen.
Mit meinen Fingern. Total cool. Und wenn ich dann fertig bin, dann gehe ich links oben auf
zurück und dann bin ich da wieder draußen. Wäre schön, wenn ich es wäre. Er sollte eigentlich
auf den Zurück-Button reagieren. Er tut es nicht. Er will uns damit wahrscheinlich zeigen. Hey,
das ist Vorführeffekt. Dann machen wir sie einmal zu. Über eine App umschalten. Nochmal frisch
auf. Starte die App Seeing AI. So, und dann sind wir sofort wieder in dem Startbildschirm,
wo er eben ständig nach Text scannt. Jetzt gehen wir nochmal rüber auf den Tab. Und dann hatten wir
vorher Gesicht erkennen. Da wechseln wir jetzt mal zur vorderen Kamera. So, hier kann ich nämlich
jetzt Personen erkennen. Das heißt, ich kann hergehen und kann dieser App beibringen, wie
sieht wer aus? Und dann kann ich die Leute mit dieser App erkennen. Dann sagt er mir nämlich,
wenn ich mir ein Foto angucke, zum Beispiel auch, okay, da ist Carina drauf, da ist Till drauf. Das
kann Apple auch. Keine Frage. Nur bei Apple kann ich das nicht alleine machen. Bei Apple brauche ich
da wieder Hilfe beim iPhone. Hier kann ich die Personen alleine beibringen, wenn ich weiß, wer
drauf ist. Und das ist einfach spitze. Wir gehen mal wieder raus. Das ist eben das, wo ich dann eine
Person trainieren kann. Und wenn wir jetzt hier mal weiter gucken. Dann gibt es natürlich hier
Fotos durchsuchen. Klar, da können wir unsere Bibliothek durchschauen. Und dann gibt es hier
den Punkt mehr noch als Tab. Hier kann man Produkte erkennen. Da guckt er wirklich nach
Barcode. Personen hatten wir schon. Währung. Ganz cooles Feature. Kann ich gucken. Okay, was ist ein
10-Euro-Schein? Was ist ein 20-Euro-Schein, 50-Euro-Schein? Ganz ehrlich, das ist eine Funktion,
die war für mich damals wahnsinnig wertvoll, als Cine AI rauskam. Aber heute machen das zu 80%,
90% meines Smart Glasses oder mal schnell ein Foto mit Be My AI. Weil es einfach schneller geht.
Bis ich mich hier reingeklickt habe und durch bin, das ist halt schon wieder so eine Sache. Das ist
nicht super praktisch, aber es geht. So, schon wieder so ein geiles Feature. Da gehen wir mal
drauf. Und dann ist das wie bei den Personen. Ich kann hier Objekte trainieren. Das heißt zum
Beispiel Kind hat eine Flasche, Schnuller oder ich tendiere dazu meinen Schlüsselbund ständig
liegen zu lassen. Dann kann ich das trainieren, der App das beibringen und wenn ich ihn das nächste
Mal sucht dann renne ich einfach mit der Kamera durch die Wohnung und lasse ihn Produkte erkennen und
das ist einfach genial. Gucken wir hier mal weiter. Meine Objekte. Da sind dann eben die ganzen Objekte
drin wie bei den Personen die wir erkennen können. Wichtig ist, wir haben hier nur die
Hauptfunktionen auf den Tabs. Es gibt ja links noch das Menü und das wenn wir jetzt aufmachen,
dann kriegen wir noch mal einen ganzen Sack voll Funktionen. Fotos durchsuchen, das hatten wir
schon. Verlauf, auch interessant. Hier kann man nämlich Bilder, die gemacht wurden, sich angucken.
Tatsächlich nur wenn sie auch gespeichert wurden. Dann gibt es hier Hilfe zur App. Hier kann man
Feedback geben. Hier kann man einstellen, was einem wichtig ist. Hier wird man über Neuigkeiten auf
dem Laufenden gehalten. Hier gibt es allgemeine Infos über die App. Wenn wir jetzt auf dem Tab
mehr sind und uns fragen, wo finden wir den Tab Szene, den es früher mal gab. Dann haben wir
jetzt ein Problem, denn Siegen AI hat einfach gesagt, okay, das brauchen wir so nicht mehr,
weil da kannst du ein Foto machen und dann hast du genau das. Und ganz ehrlich, das stimmt auch,
denn wenn wir uns das jetzt mal angucken, also die Szenenbeschreibung, so wie das früher war,
dann reicht das inzwischen wirklich, wenn wir ein Foto machen. Wir machen das jetzt hier mal. Gehe
noch mal auf Beschreiben und gerade hier Stuhl weg. So. Zu vorne Kamera wechseln. Genau. Und dann
machen wir jetzt hier mal ein Foto von mir.
Das passt. Dann machen wir Foto aufnehmen.
Das Bild zeigt eine Person, die in einem Fenster steht. Das Fenster ist offen und ermöglicht einen
Blick auf einen blauen Himmel mit verstreuten Wolken. Die Person trägt eine Sonnenbrille und ein
gestreiftes Hemd mit der Aufschrift Denimwear auf dem Brustbereich. Ein kleines Mikrofon ist am Hemd
befestigt. Die Beleuchtung deutet darauf hin, dass die Person vom Sonnenlicht, das durch das
Fenster fällt, von hinten beleuchtet wird. Genau. Das ist jetzt also mein Video-Setting, das ich hier
normalerweise auch habe, wenn ich Shorts mache für einen YouTube-Kanal. Genau, wir haben hier noch
schön Tageslicht, das reinfällt, das mich dann normalerweise von hinten beleuchtet. Ja, je nachdem,
wenn es jetzt noch ein bisschen heller ist, dann lasse ich teilweise noch die Rolle in ein kleines
Stückchen runter, eben dass das Licht wirklich nicht von oben reinblendet. Aber ihr seht schon,
die Szenenbeschreibung ist hier implementiert. Ganz schwierig, eine Person. So, das hilft mir
erst mal überhaupt nichts. Wenn ich jetzt Gruppenszenen habe, dann wird es natürlich
schwierig, wenn ich nicht weiß, wer ist Mann, wer ist Frau, wer ist Kind und und und und und.
Und da kommen wir schnell an den Punkt, wo tatsächlich Sing.ai seine Zeit ein bisschen
überlebt hat. Denn bei Be My Eyes könnte ich jetzt nachfragen. Da könnte ich jetzt einfach
sagen, hey, wer ist diese Person? Kein Problem. Ist das ein Mann? Ist das eine Frau? Was hat er
für Haare? Und so weiter. Hier kann ich nichts wirklich schließen. Aber ich kriege die ganzen
szenischen Details, die meistens ja das wichtige sind, wenn es jetzt eben nicht um die Menschen
geht. So, und dann drehen wir das Ganze mal um, wenn es eben nicht um Personen geht sozusagen,
und gucken einfach mal aus dem Fenster. Ich gehe mal hier zurück. Ich wechsle zur Rückkamera
und mache jetzt mal ein Foto hier im Querformat direkt aus dem Fenster. Gleich wieder eine
Sache, wo ich ehrlich sage, das macht halt Beamer Ice auch viel besser. Ich kann bei
Beamer Ice einfach den Lautstärke Knopf drücken und er macht das Foto. Das ist für mich
wahnsinnig wichtig, weil wenn ich mit dem Handy fotografiere, dann muss ich mich meistens
auf dem Winkel konzentrieren, dass ich nicht wacke, dass ich gerade halte und, und, und,
und das kann ich in dieser App nicht, weil ich muss diesen blöden Button fokussieren und muss
ihn mit einem Doppeltipp aktivieren. Foto aufnehmen-Taste, ihr hört's, also bitteschön einmal,
hier kommt er. Das Bild zeigt einen Parkplatz mit mehreren Fahrzeugen. Im Vordergrund befindet sich
ein überdachter Parkplatz mit fünf nebeneinander geparkten Autos. Die Autos stehen auf markierten
Parkplätzen und ein Zaun verläuft am Rand des überdachten Bereichs. Okay, das kann ich jetzt
erstmal als so ist es durchgehen lassen. Aber wirklich viel bringen, wenn ich jetzt ins Detail
gehen will, tut mir das natürlich nicht. Was kann ich da tun? Ich kann das Bild wieder untersuchen
und da wird es dann plötzlich interessant. Über dem überdachten Parkplatz befindet sich ein
großes weißes Fahrzeug, möglicherweise ein Wohnmobil, mit der Marke Detlefs auf der Rückseite
sichtbar. Dieses Fahrzeug steht senkrecht zu den darunter liegenden Autos. Im Hintergrund gibt es
einen offenen Parkplatz mit einigen weiteren Fahrzeugen, darunter ein weißes Auto, das in
der Nähe eines Gebäudes gepackt ist. Das umliegende Gebiet umfasst Gebäude mit
verschiedenen Architekturstilen, einige mit Backsteinfassaden und andere mit
verputzten Außenfassaden. Es gibt auch etwas Grün, darunter Gras und Kletterpflanzen auf den
Gebäuden. Symbol-Leiste, Foto-Untersuchen-Taste. So, das ist jetzt Foto-Untersuchen. Foto-Untersuchen-Verarbeitung.
Neun Elemente erkannt. Zum Erkunden bewegen sie den Finger über den Bildschirm. Verwende den
Rotor, um direkte Berührung für diese App zu aktivieren. Und jetzt wird es eben wieder
interessant. Ein weißer Anhänger mit einem Logo darauf enthält Text. 100, drei Bündel Striche,
grösser als Detlefs. Genau, das ist das Wohnmobil. Das nennt er jetzt einen weißen Anhänger. Okay,
kann man machen. Ich guck gerade, was hat er sonst noch erkannt? Ein Auto. Gut, das ist jetzt wieder
eine geile Info. Ein Mensch, ein Auto. Cool, das sagt mir viel. Ein schwarzes Auto auf der
Straße gepackt. Aha. Ein Heck eines Autos. Aha. Ich kann jetzt, wenn ich noch einen Sehrest habe,
mich natürlich hier besser orientieren. Ob ich dann diese Funktion brauche? Ja, kann man so und so
sehen. Es hat sicherlich Vorteile, wenn ich Objekte nicht mehr klar erkennen kann. Wenn es mir dann
zum Beispiel darum geht, okay, ich wähle das jetzt aus und weiß dann, was ich größer zoomen muss. Okay,
dann kann das was bringen. Allerdings die meisten Leute, die noch so viel mit den Augen erkennen
können, die machen das nicht über eine App und lassen sich das erst von Voice-over sagen, weil ihr
hört es hier selber auch schon. Damit komme ich ja nicht wirklich weiter. Ein Auto am Straßenrand gepackt.
Denn es fehlt mir die Info, was für ein Auto, welche Farbe. Ja klar, er hat jetzt einmal ein
schwarzes Auto gesagt, aber einmal ist keinmal. Ein rotes Auto, das an einer Mauer gepackt ist. Okay. Ein
grüner Busch an einer Betonwand. Ein grüner Busch an einer Betonwand. Ein weißes Auto mit schwarzen
Verzierungen. Ein weißes Auto mit schwarzen Verzierungen. Ich kann ungefähr die Dimensionen
abschätzen, wie groß dieses Auto ist. Also das ist jetzt hier so, würde ich sagen, drei Finger
lang. Vielleicht eineinhalb Finger breit auf dem Foto. Also ja, ich kann ein bisschen räumliche
Vorstellungen kriegen, aber man muss klar sagen, das Ganze hat Grenzen. Ja, wie klappt das jetzt
mit der Farberkennung? Das geht ja auch nicht mehr so ohne weiteres, oder? Richtig, denn ich muss jetzt
im Endeffekt ein Foto von mir machen oder von den Klamotten und muss mir das Foto beschreiben lassen.
Denn ansonsten habe ich das Problem, dass ich ja immer nur die einzelne Stelle, die gerade von der
Kamera ausgewählt ist, beschrieben kriegen würde. Und das ist ein richtiges Problem,
denn da hat eine iPhone-Kamera oder eine Smartphone-Kamera, ist bei Android genau das
gleiche. Ein Riesenproblem, weil die nimmt ganz anders wahr als ein Farberkennungsgerät.
Das heißt, für uns am Ende gilt immer ein Foto machen. Und wenn wir dann ein Foto machen,
dann können wir auch relativ gut und schnell erkennen, okay, das ist jetzt ein rotes Hemd,
das ist jetzt eine graue Hose und so weiter und so fort. Also das geht alles wunderbar.
Wichtig ist, man muss sich halt wirklich angucken, was möchte ich und wie möchte ich es erreichen.
Deswegen stelle ich inzwischen auch hier so viele Apps vor, weil jede was anderes kann.
Denn es gibt nicht mehr diese eine App, die ich als Blinder haben muss. Und wenn ich die habe,
dann ist mein Leben safe. Dann habe ich meine digitale Kompetenz erreicht. Nein,
das gibt es nicht mehr. Es gibt zig Apps, aus denen wir uns für unsere Anwendungsfälle
immer das Beste raussuchen müssen, wo wir im Endeffekt gucken müssen, was kann die App,
die das für mich wichtig ist und was kann ich damit erreichen. Und viele Kunden, die hören so
was und dann sagen sie, boah, Jocke, ganz ehrlich, was soll ich jetzt tun? Ich schaffe das nicht,
dass ich mir 20, 30, 40 Apps angucke und schaue, was macht da für mich Sinn. Für solche Sachen gibt
es uns, denn das Mytek, der zeigt euch immer wieder kostenlos neue Apps, unser Podcast SMYTECH.
Für alle, die sagen, okay, da steckt viel Arbeit drin, Jocke versucht da wirklich viel
Infos rüber zu bringen und versucht da auch wirklich Wissen zu vermitteln. Ja,
da freue ich mich natürlich auch immer, wenn es eine kleine Anerkennung von euch gibt. Aber,
und das ist ganz, ganz, ganz wichtig, jeder Mensch ist individuell und jeder Mensch hat andere
Bedürfnisse und braucht andere Sachen. Ich habe zum Beispiel Leute, für die ist es wirklich so,
die brauchen einfach immer ein perfektes Match, was ihre Klamotten angeht. Und bei denen ist es
ganz wichtig, die sagen, ich bin geburtsblind, aber ich möchte nicht rumlaufen wie ein Clown. Und ich
habe aber viele verschiedene Farbkombis, deswegen brauche ich auch immer die Info, was passt zusammen.
So dann ist die erste Adresse für solche Leute vielleicht nicht unbedingt Seeing AI, sondern
vielleicht doch eher Be My Eyes mit der Funktion Be My AI, wo ich dann immer auch nachfragen kann,
wie wirkt die Kombination, die ich gerade trage. Oder wo ich mir dann auch nochmal einen menschlichen
Freiwilligen ans Rohr holen kann, an die Kamera holen kann, der guckt drüber und sagt, hey Mensch,
das steht dir total oder steht dir überhaupt nicht. Oder es gibt Menschen, die sagen, boah,
ich tue mich einfach total schwer, Menschen zu vertrauen. Ich möchte eigentlich lernen,
was passt zusammen und ich möchte es so lernen, dass ich es verstehe. Dann kann zum Beispiel
eine generative KI wie Grog der richtige Begleiter sein, wo man dann einfach konsequent auch so ein
Bild teilt vom iPhone und dann sagt, okay, was kann ich denn jetzt aus dieser Farbkombination
schließen? Wie wirkt das Ganze auf Menschen? Welche Kombination würde warum besser passen
zu dem, was ich ausdrücken möchte. Und, und, und, und, und. Und da sind wir jetzt eigentlich an dem Punkt,
wo wir Blinde inzwischen so viele Möglichkeiten haben, wenn wir sie, und das ist immer das
Wichtige, nutzen. Denn ganz häufig höre ich dann, boah, das wusste ich gar nicht. Ich wusste
gar nicht, dass es die Möglichkeit gibt. Und dann denke ich mir immer, das ist jammer, jammer, schade.
Und dann möchte ich eigentlich immer noch viel, viel mehr solche Folgen machen, weil ich mir dann
immer denke, ich sollte noch viel mehr her zeigen und ich würde auch gerne noch viel mehr her zeigen,
aber ja, ein bisschen muss ich halt auch unseren Lebensunterhalt verdienen. Und das tue ich, indem
ich euch schule, indem ich euch beibringe, wie man an iPhone bedient als Blinder, wie man mit dem PC,
mit der Preilzeile, mit Jaws, mit NVDA umgeht. Aber ich sehe auch, wie wichtig solche Angebote
sind, wie das, was wir jetzt heute gerade die letzte dreiviertel Stunde gemacht haben. Denn
genau das ist es am Ende, was euren Alltag jeden Tag begleiten kann. Viele von euch auch wirklich
mit einer Schulung, denn ihr habt es jetzt gerade selbst gehört. Bedarfe sind so individuell,
wie Menschen sind. Und da wir unabhängig sind und natürlich ganz viele verschiedene technische
Systeme und Möglichkeiten kennen und kombinieren können, können wir natürlich auch für euren
Fall, für euren Bedarf die beste Kombination mit euch zusammen rausfinden. Ich kriege dann immer
wieder mal die Frage, ja aber Jockel, ich habe Android, ich mache kein iPhone. Dann sage ich okay,
das ist dann einfach so. Dann sind wir leider nicht dein Ansprechpartner. Ja, aber wieso macht ihr
kein Android? Ganz einfach, weil Android nicht vereinheitlicht werden kann. Jedes Android-Handy
funktioniert ein bisschen anders, unterstützt Apps anders, unterstützt Funktionen anders. Das
gibt es in der Apple Welt nicht. Denn am Ende gilt, jedes iPhone funktioniert zu 95 Prozent gleich.
Ja, und jetzt kommen gleich wieder die Kommentare aus dem Hintergrund. Naja, aber es gibt ja auch
iPhones mit einer Home-Taste und welche, die keine mehr haben. Nein, alle aktuellen iPhones
haben keine Home-Taste mehr. Ja, und natürlich gibt es noch das iPhone SE 3. Generation aus dem
Jahr 2022. Das ist so ein bisschen die Ausnahme, die die Regel bestätigt. Es ist zwar auch nicht
mehr so richtig aktuell, aber es ist tatsächlich noch das Letzte, das die Touch ID unterstützt.
Aber ansonsten sind da alle iPhones relativ gleich, was die Bedienung angeht. Und das ist
natürlich ein riesengroßer Unterschied zu Android-Systemen. So, meine Lieben, ich hoffe,
ihr habt heute oder später, wenn ihr diese Folge im SmüTech hört, was mitgenommen. Wenn es euch
gefallen hat, lasst gerne ein Like da. Viel wichtiger, wenn ihr Leute kennt, die vielleicht
noch nicht so fit sind wie ihr, dann gebt diese Infos gerne weiter. Denn Selbstbestimmung durch
digitale Kompetenz funktioniert nur, wenn auch jeder die digitale Kompetenz erlangt, die er
braucht. Und ich bedanke mich bei euch allen fürs Zuhören heute und wünsche allerseits einen
schönen Abend. Bis bald, tschüss, euer Joachim Schulze. Wenn du heute was mitgenommen hast,
dann gib doch etwas zurück. Das ist ganz einfach. Besuche die Seite danke.schulze-graben.de und
zeige Joachim, ob dir seine Show gefallen hat. Kleine Gesten machen den Unterschied.
Schulze IT-Schulung und Dienstleistungen. Dein Spezialist für Audioanleitungen,
Schulung, Fernwartung und Fritzbox-Optimierung. Mehr Infos findest du auf www.schulze-graben.de