24
cz.
2013
palikowski

Dyktowanie do smartfona

Używacie telefonu jako dyktafonu? Nie macie czasu na odsłuchiwanie i przepisywanie nagrań? Może warto przejść na aplikację, do której będziecie dyktować a telefon zmieni Wasze słowa w tekst? Smartfony (nawet te ze średniej półki) już to potrafią!

Zawsze miałem problem ze znalezieniem dobrej aplikacji, która pozwoliłaby mi szybko coś nagrać i wysłać mailem. Mam taką słabość, że w różnych dziwnych sytuacjach (np. jadąc samochodem, stojąc w kolejce do kasy, próbując zasnąć) napadają mnie pomysły na komiksy, wpisy w blogu, życiowe prawdy itd. To nic, że po tygodniu, odsłuchując te nagrania, w 90% okazuje się, że to banały i żadne tam odkrywcze rzeczy. Ale boję się, że jeśli gdzieś sobie nie zapiszę takich "olśnień" to zgubię te wartościowe 10%.

Dotąd proces wyglądał tak - nagrywałem kilka minut na dyktafon i wysyłałem mailem na własną skrzynkę, po czym... w 80% zapominałem o sprawie albo nie chciało mi się tego odsłuchiwać. Do dziś mam kilkadziesiąt takich nieodsłuchanych nagrań (kategoryzuję je sobie w gmailu jako "_nagrania" i pewnie poleżą tam do mojej emerytury).

Ostatnio odkryłem, że zwykła aplikacja z gatunku "żółte karteczki" (typu bardzo lekki i funkcjonalny ColorNote) plus mechanizm rozpoznawania mowy dostępny w telefonie klasy Galaxy Ace 2 (taki w tej chwili używam) wystarczają, aby podyktować naprawdę spory tekst. Wystarczy, zamiast mozolnie wklepywać kolejne słowa z klawiatury, kliknąć ikonę mikrofonu (na prawo od spacji) i podyktować notatkę (najlepiej głośno, wyraźnie, nie za szybko).

Oczywiście nie ma róży bez kolców. Dyktując Kilka pierwszych notatek odkryłem kilka wad rozwiązania.

Pierwsza z nich to przekręcanie słów. O ile dyktujemy naprawdę wyraźnie (to jeszcze nie problem) oraz nie używamy trudnych czy obcojęzycznych słów (a to już trudniejsze) to rozpoznawanie mowy działa naprawdę świetnie.

AKTUALIZACJA - nie do końca wiem czyja to zasługa ale niektóre aplikacje na Adroidzie 4.x potrafią podkreślić wyrazy, których algorytm nie był pewien. Tapnięcie w taki wyraz pokazuje możliwe wersje danego słowa, wśród których bardzo często jest dokładnie to, co chcieliśmy powiedzieć.

Druga, większa moim zdaniem wada, to bardzo szybkie wyłączanie się nagrywania - wystarczy zrobić sekundową przerwę a aplikacja zaczyna konwertować mowę na tekst i przestaje nagrywać. Trzeba pilnować jej i co chwila wciskać ikonę mikrofonu, co nie jest zbyt wygodne podczas np. jazdy samochodem.

AKTUALIZACJA - na Android 4.x problem ten już nie występuje, przerwy między słowami czy zdaniami mogą być kilkusekundowe, łatwo też wrócić do przerwanego dyktowania.

Poniżej wklejam bez korekty tekst podyktowany do mikrofonu i zapisany w aplikacji ColorNote, w którym właśnie o tym mówię:

sposób dyktowania przez google voice jest bardzo fajnym sposobem notowania
zapisywania duszy zapisywanie dłuższych notatek jest bardzo uciążliwe ponieważ trzeba mówić bez przerwy
nie można robić przerw nawet na zaczerpnięcie oddechu dlatego dobrze byłoby skonstruowanie takiego mechanizmu który pozwalałby skonfigurować ten mechanizm żeby im dłuższe partie tekstu dyktuje my tym dłuższe były przerwy dłuższy był czas kiedy interfejs czeka na prowadzenie dalszej części tekstu
wtedy po wypowiedzeniu do mikrofonu krótkiej komendy bądź krótkiego nazwiska i imienia interfejs odrazu by zareagował po odczekaniu ułamka sekundy 3 sekundy ciszy
natomiast food podyktowanie dłuższego zdania interface czekał by odpowiednio dużej zakładając że użytkownik czy mówiący robi pauzę na zaczerpnięcie oddechu bądź zastanowienie się nad następnym zdaniem jakie sa podyktowane

Jak widać czasem aplikacja rozpoznaje "trzy" zamiast "czy" albo "dużej" zamiast "dłużej". Jednak poprawienie takiej notatki jest i tak dużo szybsze niż przepisanie tego co mamrotaliśmy do mikrofonu i mamy jako nagranie.

Poniżej jeszcze jeden przykład, notatki, którą robiłem jadąc samochodem i w której widać wyraźnie, że szybkie mówienie nie sprzyja składności wypowiedzi :):

potrzebny byłby mi jakis soft do robienia notatek głosowych. najlepiej taki który dobrze rozpoznawał by move i potrafił by ją odrazu skonwertować tekst kto by mógł w końcu to powiedzieć do telefonu wszystkie twoje pomysły niestety w tej chwili google słabo rozpoznaje mój głos i często robi błędy literówki i cały tekst później trzeba przejrzeć i poprawić to nie jest zbyt wygodne na telefonie chyba że mówi się bardzo wyraźnie i powoli wtedy telefon dużo lepiej rozpoznaje mowę cały ten tekst do poprzedniego zdania był mówiony dosyć szybko a poprzednie zdanie to zdanie i następne zdania są mówione dużo wolniej jak widać po wolne mówienie poprawia mocno rozpoznawanie mowy jego precyzję

Miłego dyktowania :)