"Hello need help" есть api под from string to voice (из строки в голос). Кто находил апи наоборот api from voice to string (из голоса в строку). Очень надо желательно на Python но на крайняк можно и на Java.
И немного по теме: http://stackoverflow.com/questions/3774867/web-services-for-converting-audio-speech-to-text возможно есть что-то подходящее.