Today we got to the end of the last recording phase for the Microsoft engine text-to-speech. With more than 3.000 sentences, the project counts on the voice talent Ana Paula Couto (journalist at Globo News) and the adventures of the edition process will last until Thursday at Produlz.com in São Paulo.
Although we´re always asking for news in our conversations, we still have no information on the date of the BETA version release, but as soon as we have any news you’ll be the ones to know in first place.
Wait for it!
Poucos conhecem o Microsoft Office Communications Server 2007 Speech Server, mais um produto revolucionário da Microsoft, utilizando o que há de mais avançado na tecnologia de reconhecimento e síntese da fala em Português disponibilizado pelo MLDC.
No vídeo abaixo assista a demonstração do Microsoft Office Communications Server 2007 Speech Server. permitindo ao usuário ligar para um número de telefone e obter informações sobre as várias sessões que vão decorrer no evento Techdays2008, podendo procurar por uma sessão em particular através do orador ou do código da sessão, usando comandos de fala, totalmente em Português (Portugal).

Post original de Pedro Silva em http://blogs.msdn.com/tagarela/archive/2008/03/07/quid-novi-22.aspx
Seria tão bom apenas pensar e falar não é mesmo!?
Imaginem as inúmeras aplicações: primeiramente permitirá a comunicação dos mudos, pessoas com mal de parkinson, derrames, dificuldades na fala. Além disso ninguém mais ouvirá suas conversas ao celular, poderemos falar ao celular enquanto estivermos dirigindo sem tomar multas
, fazer centenas de ligações sem cansar a voz, aos professores falarem em suas aulas mesmo quando estiverem sem voz, entre tantas outras.
Revolucionário e assustador. Parece irreal, mas já é possível, e escrevam no futuro vai virar moda.
Como funciona: Quando a pessoa está com intenção de se comunicar, impulsos neurológicos são enviados pelo cérebro a região do pescoço e são captados por uma espécie de “coleira” ligada ao computador. O aparelho permite que estes sinais, sejam interpretados e convertidos em fala sintética (text to speech).
Confesso que fiquei muito impressionado, pois pensava que demorariam mais alguns anos para chegarmos a tal ponto.
Assista aos vídeos com demonstrações do aparelho. Veja você mesmo e faça seus comentários!
Acessem também o website: http://www.theaudeo.com
Mind Controlled Wheelchair from NIWeek 2007
Worlds First, Live Voiceless Phone Call Made at TIDC 2008
Hoje encontrei um artigo muito interessante sobre as regras de pronúncia para síntese de voz em português do Brasil, escrito por Paulo Eduardo Ostermann Filho, sob orientação de Dante Augusto Couto Barone.
Com uma linguagem de fácil compreensão o artigo fala sobre o surgimento da fala sintética, e uma introdução bem resumida sobre como funciona o processo de síntese da fala.
Leia o artigo: http://www.inf.ufrgs.br/pos/SemanaAcademica/Semana2000/PauloOstermann/
Disponível em vários idiomas inclusive em português, estas vozes em SAPI5 ocupam aproximadamente 100mb de expaço em disco, suportam ajuste de velociade. As vozes estão disponíveis por U$45 cada e podem ser baixadas ou entregues via CD – http://www.nextup.com/scansoft.html
Lembrando que o Software Nuance RealSpeak Solo® deve ser comprado separadamente aqui: http://www.nuance.com/realspeak/solo/
Escute a amostra da voz sintetizada brasileira: http://nextupdownloads.com/scansamples/Raquel.mp3
tagged in Brasil, brazil, Fala Sintética, NextUp, Nuance, português, síntese de voz, Text-to-Speech, TTS, vozes brasileiras, vozes sintéticas
34 Comments →
Concluindo o post anterior entrei no Blog Máquinas Falantes e encontrei o post falando sobre o Techdays 2008 (http://www.techdays.pt). O evento será precedido pelo maior lançamento da história da Microsoft, onde serão apresentados novos produtos que constituem grandes avanços tecnológicos.
No dia 13 de março de 2008, as 17 horas (horário de Lisboa – Portugal), será realizada uma conferência sobre desenvolvimento de aplicações Speech que nos trará inúmeras informações a respeito da tecnologia. Veja o prospecto completo abaixo:
DEV04 – “Are You Talking to Me?” – Como Integrar e Utilizar Tecnologia de Fala para o Desenvolvimento de Aplicações Desktop e IVR
Dia 13 Sala A5 17:00 (horário de Lisboa)
http://www.techdays.pt/session/2008/DEV04.aspx
A área crescente de tecnologia de fala, tanto ao nível do Reconhecimento como da Síntese, tem vindo a ganhar um enorme interesse e popularidade nos últimos anos, tanto no mercado empresarial como no mercado doméstico. À medida que a tecnologia evolui, têm vindo a surgir muitas aplicações cliente desktop, como por exemplo a leitura automática de documentos e emails usando a síntese de fala, bem como sistemas telefónicos IVR que beneficiam de reconhecimento de fala cada vez mais robusto e síntese de texto para fala com cada vez mais qualidade. Recentemente a Microsoft lançou o “Windows Speech Recognition” no Windows Vista, que possibilita aos utilizadores a interacção com o seu computador usando apenas a fala e o Microsoft Office Communications Server 2007 Speech Server, uma plataforma completa de IVR. Esta sessão vai cobrir a .NET Framework Speech API e o OCS 2007 Speech Server para o desenvolvimento de aplicações Windows desktop e aplicações telefónicas IVR respectivamente, tirando partido da tecnologia de fala. Iremos utilizar Reconhecimento e Síntese de fala em Português Europeu, demonstrando os mais recentes resultados do Microsoft Language Development Center (www.microsoft.com/portugal/mldc). Serão apresentados vários exemplos de aplicações, demonstrações e desenvolvimento hands-on, incluindo a facilidade de interacção com um Robot Lego MindStorm usando tecnologia de fala através da plataforma Microsoft Robotics Studio 1.5, uma aplicação do tipo portal-de-notícias e a Agenda Telefónica do TechDays 2008.
Orador(es)
 |
Pedro é Lead Software Development Engineer no Microsoft Language Development Center (MLDC). Juntou-se à Microsoft em 2006 e tem vindo a especializar-se em desenvolvimento de software usando as novas tecnologias de Speech da Microsoft. Actualmente, é responsável pelas actividades de desenvolvimento de software no Centro e pela disponibilização da tecnologia de fala em Português desenvolvida no MLDC através do Programa Beta. Tem um Mestrado e Licenciatura em Engenharia de Telecomunicações e Informática atribuídos pelo Instituto Superior de Ciências do Trabalho e da Empresa (ISCTE), onde também foi professor assistente de Computação Gráfica.
|
 |
Mário Vaz Henriques juntou-se à Microsoft em Setembro de 2006, mais precisamente ao Microsoft Language Development Center (MLDC) onde assumiu funções de Software Development Engineer. Tem um Mestrado e Licenciatura em Engenharia Informática atribuídos pela Faculdade de Ciências da Universidade de Lisboa.
|
Hoje na Campus Party foram entrevistados 100 participantes, com idades de 18 a 50 anos, dos setores de Software Livre, Desenvolvimento, Robótica e Blog. O resultado mostrou números bombásticos. Foram feitas 3 perguntas simples, uma de cada vez e as respostas podiam ser sim ou não. Eis o resultado: 1) Você sabe o que é TTS? 97% dos entrevistados não sabem o que é a sigla, nem o que significa TTS. Uma pequena minoria confunde com TTL que não tem nada haver. Outros 3% disseram sim, que reconheciam a sigla, mas tinham apenas poucas informações e muitas dúvidas. 2) Você sabe o que é Text-to-speech? 94% responderam que também não sabiam o que é Text To Speech. Os outros 6% disseram sim, mas não tinham nenhuma informação relevante, apenas um usuário do Software livre que até comentou sobre o TTS disponível no Gnome. 3) Você sabe o que é Síntese de Voz ou fala sintética? 69% responderam que não, que continuavam a não saber o que era Síntese de Voz. Os outros 31% responderam que sim, sabiam o que era, e apenas 4% já usaram a ferramenta. A tecnologia da fala sintética foi criada em 1980 e em 1984 já estava disponível no primeiro computador com processamento de voz, chamado de Apricot, porém sua capacidade era muito limitada. A pesquisa mostrou que no Brasil, apesar de tanto tempo, é como se a tecnologia não existisse mesmo considerando que o TTS já está disponível no Windows XP, dentro do Painel de Controle, da opção Fala. Nossa expectativa é que o ano que vem os números sejam diferentes, com um maior número de usuários adequados a ferramenta, ainda mais em um evento como esse com hard users por todos os lados. Informações extra-oficiais apostam no lançamento da versão Beta do TTS da Microsoft, integrado ao Windows Vista, Office 2007 e ao Media Center no segundo semestre de 2008, inclusive com Speech Recognition em 2009. Você que já sabe o que é TTS, divulgue para seus contatos, pois esta tecnologia trará inúmeras oportunidades de negócios e agora é o momento de aprofundar seus conhecimentos. Até a próxima. Fernando Areias TTS Brasil