PTO for your hands?!

VON Dr. Wolf SiegertZUM Donnerstag Letzte Bearbeitung: 8. November 2025 um 17h51minzum Post-Scriptum

 

A Speech-to-Text Announcement?

Hier ein Auszug aus dem Microsoft Blog von Yusuf Mehdi, Executive Vice President, Consumer Chief Marketing Officer vom 16. Oktober 2025: Making every Windows 11 PC an AI PC

People are already talking at their PCs every day for dictation and note taking, transcriptions, searching, and with important accessibility features like Voice access and Voice typing. Now, your PC can understand you.

P.S.

In dem eigenen Arbeitsumfeld ist aber bislang noch nicht einmal die Suche nach einem optimalen Voice typing - Programm abgeschlossen - eines, das nicht in der Cloud operiert, wie zum Beispiel transcribe,, ...

Are your solutions only cloud-based, or do you on-premise applications as well?
Our solution is cloud-based. We do have offline transcriptions available for iOS app recording feature - but since it is local it is not as good as cloud-based full-featured transcription.

... sondern on-premise, wie zum Beispiel Dragon. Dort wird für die Version 16 keine Vertriebsmöglichkeit mehr angeboten.

Am 8. Oktober 2025 wurde diese Mitteilung veröffentlicht:

Microsoft Cloud for Healthcare Dragon Copilot

What’s new in Microsoft Dragon Copilot 3.3.2

We’re pleased to announce the general availability of Dragon Copilot in France, Germany, Austria and Ireland. This marks a significant milestone in the expansion of our mission to provide innovative and reliable solutions that enhance productivity, clinician wellbeing, patient experiences and financial impact.
The release of Dragon Copilot 3.3.2, includes a localized product experience for users in these regions tailored to their local needs as well as analytics enhancements for users in the US.

Auf jeden Fall empfiehlt sich vorab diese Lektüre:
Wie schützt Microsoft bei der Verbesserung seiner Spracherkennungstechnologie meine Privatsphäre?

Während alle voreingestellten Stimmen mit Dir reden, als würden sie Dich schon kennen ...

... gelingt auch noch mehrfachen Versuchen die Aktivierung der Mikrofon-Schnittstelle nicht:

Als auch zu guter Letzt auch diese Schwierigkeiten ausgeräumt werden konnten, war das Ergebnis von der inhaltlichen Seite unbefriedigend. Es entsprach nicht den zuvor von Microsoft selbst vorgegebenen und teils hier schon zitierten Aukünften und Angeboten:

Gibt es Alternativen? Aus den derzeit vorliegenden Angeboten werden weiterhin in Erwägung gezogen:

Letterly ist ein KI-gestütztes Diktierwerkzeug, das entwickelt wurde, um Ihre Stimme zu transkribieren und in übersichtliche Absätze zu strukturieren. Im Gegensatz zu den meisten Diktiersoftwares, die einfach Sprache-zu-Text-Transkripte erstellen, verwendet Letterly natürliche Sprachverarbeitung (NLP). Diese natürliche Sprachverarbeitung verfeinert das Ergebnis, wenn Sie strukturierte Ergebnisse bevorzugen, ohne von Grund auf neu bearbeiten zu müssen.

Hauptfunktionen

Intelligente Absatzstrukturierung: Letterly organisiert diktierte Sprache automatisch in sinnvolle Absätze, korrigiert den Fluss und die Satzstruktur für einen sauberen, sofort verwendbaren Entwurf.
Ton- und Klarheitsverbesserung: Letterly wendet subtile Verfeinerungen an Ton, Grammatik und Formulierung an, was das erstellte Transkript natürlich und gut konstruiert klingen lässt.
Einfache Diktieroberfläche: Bei Letterly können Sie sofort mit minimalem Aufwand diktieren. Die Benutzeroberfläche ist ablenkungsfrei und für kontinuierliche Spracheingabe optimiert.
Export- und Freigabeoptionen: Sobald das strukturierte Transkript fertig ist, können Sie es sogar als Text exportieren oder direkt per E-Mail versenden.
Vorteile:

Formatiert Diktate automatisch in saubere Absätze
Ideal für Content-Ersteller und Gedankenstücke
Leichte und minimale Benutzeroberfläche
Nachteile:

Fehlt Echtzeit-Kollaborationsfunktionen
Begrenzte Sprachunterstützung
Nicht geeignet für Meetings oder Interviews mit mehreren Sprechern
Am besten geeignet für: Letterly ist ideal für Benutzer, die ihre langformatigen Sprachdiktate in strukturierten, veröffentlichungsfertigen Text umwandeln möchten.

Dieser Text findet sich auf der Webseite des konkurrierenden Anbieters transkriptor - was für diesen spricht:

Wie Transkriptor Audio in Text umwandelt
Transkriptor ist ein KI-Transkriptionstool, das Audio- oder Videodateien analysiert, um Transkripte mit 99% Genauigkeit zu erstellen. Es unterstützt über 100 Transkriptions- und Übersetzungssprachen und kann lange Transkripte in gut strukturierten Text zusammenfassen. Es ist viel erschwinglicher als Microsoft Copilot und kostet nur 4,99 $ pro Monat.

Aber dann stellt sich heraus, dass diese Software keine on-premise-Lösung anbietet und die eingesprochenen Texte nicht direkt in Word dargestellt werden können :-( ...