A biblioteca Text-To-Speech (TTS) do projeto do Google chamado “Eyes-Free“, permite que os desenvolvedores adicionem fala em suas aplicações para o sistema operacional Android. O desenvolvedor dá ao objeto TTS uma sentença de texto, e o TTS converte essa sentença em fala ao usuário.
Para que isso seja possível é utilizado o engine eSpeak (http://espeak.sourceforge.net/) . Um sintetizador de fala open source compacto para inglês e outros idiomas, para Linux e Windows.
REQUISITOS
O requisite para usar o engine eSpeak, é ter espaço disponível em um cartão SD acessível ao telefone. Os arquivos de voz para o eSpeak serão baixados e descomprimidos no cartão SD na primeira execução do TTS.
Caso o cartão SD esteja montado no computador, não poderá ser acessado pelo Telefone. Você precisa desmontar o cartão SD do computador antes, para o TTS funcionar corretamente.
Configurando um projeto Eclipse para usar TTS
1. Configure um projeto Androind como você faz normalmente.
2. Va até Project > Properties > Java Build Path > Libraries e clique em “Add External JARs…” Então adicione o arquivo TTS_library_stub.jar.
3. Começe a programar!
Para maiores informações acesse http://eyes-free.googlecode.com/ ou este tutorial completo (em inglês) http://eyes-free.googlecode.com/svn/trunk/documentation/tutorial/tutorial.html.
Outra fonte importante para trocar compartilhar experiencias e buscar ajuda é o grupo de discussão TTS-for-Android (http://groups.google.com/group/tts-for-android/)
Até o próximo post.
Fernando M. Areias
Produlz.com
We are really glad to know that Loquendo (Italy) will provide their TTS technology to Nav N Go (Hungary), a manufacturer of GPS systems. The most interesting part of this story is that both are clients of Produlz.com.

According to unofficial information from a source in Nav N Go, the text-to-speech really caused trouble to the GPS manufacturers business, due to the fact that parto f them incorporated the TTS technology in their GPs systems, turned functions that didn’t exist before – such as saying the name of the streets – into essential characteristics for the new customers, eager for new technology.
Through this announcement, Nav N Go clearly showed thatm they are totally prepared to face this new step, selecting the excellent Loquendo technology, one of the best in the market.
When will we have this technology in Brazil? We’ll leave this question to another post.
Today we got to the end of the last recording phase for the Microsoft engine text-to-speech. With more than 3.000 sentences, the project counts on the voice talent Ana Paula Couto (journalist at Globo News) and the adventures of the edition process will last until Thursday at Produlz.com in São Paulo.
Although we´re always asking for news in our conversations, we still have no information on the date of the BETA version release, but as soon as we have any news you’ll be the ones to know in first place.
Wait for it!
A busca pelo leitor text-to-speech ideal continua. Estou testando várias ferramentas e em breve farei um relatório completo com comentários e comparações. A ferramenta que estou testando agora é o Natural Readers – um leitor tem uma voz mais próximo da fala natural, proporcionando um conforto maior ao ouvinte, porém ainda sem uma versão em português. O “reader” possui uma versão trial que pode ser baixada em http://naturalreaders.com, porém a versão trial vem sem a voz natural, apenas com o Microsoft Sam. O software promete páginas web, pdf’s, documentos do word, e-mails do outlook e converter o texto em arquivos MP3, porém não pude testar estas funcionalidades, pois a versão trial não tem essas funções habilitadas. A voz do Natural Readers é muito melhor do que as vozes da AT&T e NeoSpeech – é muito mais interpretada e tem menos “gaps”, compare – http://naturalreaders.com/sample.htm. Até hoje realmente é uma das vozes em inglês mais naturais que ouvi. Bom é isso. Até a próxima. Fernando Areias
Poucos conhecem o Microsoft Office Communications Server 2007 Speech Server, mais um produto revolucionário da Microsoft, utilizando o que há de mais avançado na tecnologia de reconhecimento e síntese da fala em Português disponibilizado pelo MLDC.
No vídeo abaixo assista a demonstração do Microsoft Office Communications Server 2007 Speech Server. permitindo ao usuário ligar para um número de telefone e obter informações sobre as várias sessões que vão decorrer no evento Techdays2008, podendo procurar por uma sessão em particular através do orador ou do código da sessão, usando comandos de fala, totalmente em Português (Portugal).

Post original de Pedro Silva em http://blogs.msdn.com/tagarela/archive/2008/03/07/quid-novi-22.aspx
Procurando na internet uma leitor tts para inserir em um website, encontrei o ImTranslator que possue um engine Text to Speech com vozes em vários idiomas, inclusive português Brasileiro. Acesse o site, selecione o idioma e teste as vozes: http://free-translator.imtranslator.net/speech.asp Ele não faz exatamente o que eu queria, não le as páginas do web site, porém você pode colocar um leitor para ler o que for digitado pelo usuário, no idioma que for ecolhido. Se você pretende inserir no seu site procure no canto esquerdo o link: “Para Webmasters: adicione funcionalidade TTS ao seu website” Bom proveito. Fernando Areias
Seria tão bom apenas pensar e falar não é mesmo!?
Imaginem as inúmeras aplicações: primeiramente permitirá a comunicação dos mudos, pessoas com mal de parkinson, derrames, dificuldades na fala. Além disso ninguém mais ouvirá suas conversas ao celular, poderemos falar ao celular enquanto estivermos dirigindo sem tomar multas
, fazer centenas de ligações sem cansar a voz, aos professores falarem em suas aulas mesmo quando estiverem sem voz, entre tantas outras.
Revolucionário e assustador. Parece irreal, mas já é possível, e escrevam no futuro vai virar moda.
Como funciona: Quando a pessoa está com intenção de se comunicar, impulsos neurológicos são enviados pelo cérebro a região do pescoço e são captados por uma espécie de “coleira” ligada ao computador. O aparelho permite que estes sinais, sejam interpretados e convertidos em fala sintética (text to speech).
Confesso que fiquei muito impressionado, pois pensava que demorariam mais alguns anos para chegarmos a tal ponto.
Assista aos vídeos com demonstrações do aparelho. Veja você mesmo e faça seus comentários!
Acessem também o website: http://www.theaudeo.com
Mind Controlled Wheelchair from NIWeek 2007
Worlds First, Live Voiceless Phone Call Made at TIDC 2008
Hoje encontrei um artigo muito interessante sobre as regras de pronúncia para síntese de voz em português do Brasil, escrito por Paulo Eduardo Ostermann Filho, sob orientação de Dante Augusto Couto Barone.
Com uma linguagem de fácil compreensão o artigo fala sobre o surgimento da fala sintética, e uma introdução bem resumida sobre como funciona o processo de síntese da fala.
Leia o artigo: http://www.inf.ufrgs.br/pos/SemanaAcademica/Semana2000/PauloOstermann/
Disponível em vários idiomas inclusive em português, estas vozes em SAPI5 ocupam aproximadamente 100mb de expaço em disco, suportam ajuste de velociade. As vozes estão disponíveis por U$45 cada e podem ser baixadas ou entregues via CD – http://www.nextup.com/scansoft.html
Lembrando que o Software Nuance RealSpeak Solo® deve ser comprado separadamente aqui: http://www.nuance.com/realspeak/solo/
Escute a amostra da voz sintetizada brasileira: http://nextupdownloads.com/scansamples/Raquel.mp3
tagged in Brasil, brazil, Fala Sintética, NextUp, Nuance, português, síntese de voz, Text-to-Speech, TTS, vozes brasileiras, vozes sintéticas
34 Comments →
Concluindo o post anterior entrei no Blog Máquinas Falantes e encontrei o post falando sobre o Techdays 2008 (http://www.techdays.pt). O evento será precedido pelo maior lançamento da história da Microsoft, onde serão apresentados novos produtos que constituem grandes avanços tecnológicos.
No dia 13 de março de 2008, as 17 horas (horário de Lisboa – Portugal), será realizada uma conferência sobre desenvolvimento de aplicações Speech que nos trará inúmeras informações a respeito da tecnologia. Veja o prospecto completo abaixo:
DEV04 – “Are You Talking to Me?” – Como Integrar e Utilizar Tecnologia de Fala para o Desenvolvimento de Aplicações Desktop e IVR
Dia 13 Sala A5 17:00 (horário de Lisboa)
http://www.techdays.pt/session/2008/DEV04.aspx
A área crescente de tecnologia de fala, tanto ao nível do Reconhecimento como da Síntese, tem vindo a ganhar um enorme interesse e popularidade nos últimos anos, tanto no mercado empresarial como no mercado doméstico. À medida que a tecnologia evolui, têm vindo a surgir muitas aplicações cliente desktop, como por exemplo a leitura automática de documentos e emails usando a síntese de fala, bem como sistemas telefónicos IVR que beneficiam de reconhecimento de fala cada vez mais robusto e síntese de texto para fala com cada vez mais qualidade. Recentemente a Microsoft lançou o “Windows Speech Recognition” no Windows Vista, que possibilita aos utilizadores a interacção com o seu computador usando apenas a fala e o Microsoft Office Communications Server 2007 Speech Server, uma plataforma completa de IVR. Esta sessão vai cobrir a .NET Framework Speech API e o OCS 2007 Speech Server para o desenvolvimento de aplicações Windows desktop e aplicações telefónicas IVR respectivamente, tirando partido da tecnologia de fala. Iremos utilizar Reconhecimento e Síntese de fala em Português Europeu, demonstrando os mais recentes resultados do Microsoft Language Development Center (www.microsoft.com/portugal/mldc). Serão apresentados vários exemplos de aplicações, demonstrações e desenvolvimento hands-on, incluindo a facilidade de interacção com um Robot Lego MindStorm usando tecnologia de fala através da plataforma Microsoft Robotics Studio 1.5, uma aplicação do tipo portal-de-notícias e a Agenda Telefónica do TechDays 2008.
Orador(es)
 |
Pedro é Lead Software Development Engineer no Microsoft Language Development Center (MLDC). Juntou-se à Microsoft em 2006 e tem vindo a especializar-se em desenvolvimento de software usando as novas tecnologias de Speech da Microsoft. Actualmente, é responsável pelas actividades de desenvolvimento de software no Centro e pela disponibilização da tecnologia de fala em Português desenvolvida no MLDC através do Programa Beta. Tem um Mestrado e Licenciatura em Engenharia de Telecomunicações e Informática atribuídos pelo Instituto Superior de Ciências do Trabalho e da Empresa (ISCTE), onde também foi professor assistente de Computação Gráfica.
|
 |
Mário Vaz Henriques juntou-se à Microsoft em Setembro de 2006, mais precisamente ao Microsoft Language Development Center (MLDC) onde assumiu funções de Software Development Engineer. Tem um Mestrado e Licenciatura em Engenharia Informática atribuídos pela Faculdade de Ciências da Universidade de Lisboa.
|