Centro da Microsoft para tratamento computacional da fala recebe apoio da Agência de Inovação Bartender 8 Novembro

Comments Off

Imagine-se a ditar em português ao computador, que transformará em texto o que lhe é dito. Ou, então, a ouvir a máquina ler os e-mails enquanto faz outra coisa. É disso que está a tratar o Centro Microsoft para o Desenvolvimento da Linguagem em Portugal. Hoje, assina um contrato com a Agência de Inovação, que financiará os seus projectos com 178 mil euros. 
Este é o único centro de investigação dedicado ao tratamento computacional de uma língua que a empresa tem fora da sede, nos EUA. O seu objectivo passa pelo tratamento computacional da língua portuguesa, ou seja, iniciativas na área do reconhecimento da fala pelo computador.

Em curso estão seis projectos submetidos ao programa Nitec, destinado a incentivar a criação de núcleos de investigação nas empresas. Esse programa é promovido pela Agencia de Inovação, financiada pelos ministérios da Economia e da Ciência.

Miguel Sales Dias, director do centro da Microsoft, adianta que este apoio deverá estimular o investimento da Microsoft, que financia o centro com cerca de 500 mil euros por ano. E permitirá avançar com dois outros projectos na área da síntese da fala, ou seja, na transformação do texto escrito em fala.

Um dos projectos já em curso chama-se VoxCorp. Desenvolvido com o Instituto de Engenharia de Sistemas e Computadores (Inesc ID), consiste na criação de bases de dados de fala que é transformada em texto. O objectivo é criar um sistema de reconhecimento de fala associado ao Exchange, a plataforma de gestão de contactos e correio electrónico na qual assenta o Outlook, o programa de e-mail mais usado do mundo. Quando estiver concluído, dentro de um ano, será possível pedir ao Outlook, em português, para alterar a agenda ou fazer uma chamada.

Outro projecto, o TranSpeech, desenvolverá uma aplicação para transcrever e anotar a fala, para corrigir e limar as imperfeições na base de dados do VoxCorp.

O Acoustics agrega várias bases de dados de fala gravada e integrará o português falado no Brasil. “É um dos projectos centrais”, explica Miguel Sales Dias. Pretende criar uma tecnologia de base (uma espécie de sistema operativo) para desenvolver aplicações de reconhecimento de fala que permitirão dar ordens à máquina, mas não a põem a processar toda a linguagem.

O Euro PT Connect é o único projecto que já está a funcionar na Microsoft. É um sistema de atendimento telefónico em que basta dizer o nome do destinatário para que a chamada seja encaminhada para a sua extensão.

O SpeechApps está a ser desenvolvido com vários parceiros e destina-se sobretudo às universidades. “É uma espécie de chapéu-de-chuva onde cabem os projectos de investigação nesta área”, explica Miguel Sales Dias.

Finalmente, o Lexicon é um dos projectos mais ambiciosos: consiste no processamento de fala espontânea. Permitirá fazer um ditado para o processador Word que o transformará em texto. “Exige que haja análise estatística, muito conhecimento de linguística computacional e bases de dados faladas e escritas muito extensas, com 300 a 500 milhões de palavras”, adianta Sales Dias. Por ser tão complexo, só deverá dar frutos daqui a dois ou três anos.

FONTE: Público.pt

Os comentarios estão fechados.

Artigos relacionados

    Investigar em RSS