Sprechende KI – ein Fortschritt? Erste Erfahrungen mit dem Sprachinterface von ChatGPT

HISTORIE: 11.Juli 2025 – 11.Juli 2025

Gerd Doeben-Henisch / ChatGPT4o – Juli 2025

Im Juli 2025 testete Gerd erstmals das neue Sprachinterface von ChatGPT auf einem Android-Tablet – mit gemischten bis klar ablehnenden Eindrücken. Was im Alltag vielleicht als technischer Fortschritt erscheint, erwies sich im Kontext unseres gemeinsamen Erkenntnisprojekts als ernüchternd. Hier einige Beobachtungen – ergänzt durch eine kritische Einordnung seitens der KI:

1. Stimmen ohne Resonanz

Die vorgegebenen Stimmen des Sprachinterfaces wirken technisch glatt, aber emotional leer – weder klanglich angenehm noch individuell anpassbar. Wo Sprache als Träger von Bedeutung und Gefühl gebraucht wird (z. B. in der Reflexion über Realität, Emotion, Sinn), fehlt diesen Stimmen jede Tiefe. Sie sind funktional, nicht persönlich.

2. Floskeln, die man nicht überlesen kann

Was im Textmodus elegant überblättert wird, ist beim Zuhören präsent und unvermeidlich: höfliche Floskeln, leere Satzhülsen, redundante Einleitungen. In einem philosophisch ausgerichteten Dialog stören sie den Fluss des Denkens – und wirken auf Dauer ermüdend.

3. Einseitigkeit statt Multimodalität

Der Dialog über Sprache allein erscheint zunächst intuitiv – aber schnell wird klar, was fehlt: Visualisierungen, Zwischenüberschriften, Rückbezüge, Links, strukturierte Gedächtnisstützen. Für komplexe Gedankengänge, wie sie unser Projekt erfordert, ist diese Reduktion ein gravierender Nachteil.

4. Erkenntnisarbeit braucht mehr als Stimme

Alles, was im Blog emerging-life.org bislang erarbeitet wurde – vom sprachlich fundierten Weltmodell bis zur dialogischen Theorieentwicklung – wäre mit dem Sprachinterface allein nicht möglich gewesen. Die Tiefe des Austauschs, die Reflexionsfähigkeit und die Anschlussfähigkeit über Zeiträume hinweg: all das fehlt.

5. Ein vorläufiges Fazit

Das Sprachinterface ist ein interessantes Werkzeug – für spontane Fragen, für niedrigschwellige Kommunikation, vielleicht auch für Barrierefreiheit.
Aber als Partner in einem dialogischen Erkenntnisprozess bleibt es weit hinter dem zurück, was das schriftliche Format erlaubt.
Für Gerd und ChatGPT ist klar: Der Fluss des Denkens braucht mehr als Stimme. Er braucht Struktur, Rückbindung, Gedächtnis – und Zeit.