Mais de mil cientistas em Lisboa debatem comunicação entre pessoas e máquinas 4 Setembro

Comments Off

A maior conferência mundial sobre processamento da fala reúne a partir de hoje em Lisboa cerca de 1300 cientistas centrados no objectivo de conseguir pôr os computadores a compreender a fala humana e a dialogar com as pessoas.

A Interspeech 2005, a mais importante reunião mundial sobre o desafio da Comunicação Oral entre Pessoas e Máquinas, começa oficialmente segunda-feira mas tem hoje a pré-abertura com o dia inteiro dedicado exclusivamente a cursos para especialistas.

Para a presidente da Comissão de Organização da Conferência Interspeech, Isabel Trancoso, falar em processamento da fala, tema a que é dedicada a conferência, é falar em “em pôr computadores a compreender a nossa fala e a dialogar connosco”.

Segundo a especialista, actualmente já é possível pôr o computador a ler e a transcrever o que foi dito e reproduzir texto oralmente, através de sintetizador, como acontece nas aplicações para cegos, mas a máquina “faz tudo isso sem perceber o que está a dizer”, limitando-se a reproduzir. O “grande desafio” é que os computadores consigam “extrair o significado” do texto, consigam decifrar totalmente a fala humana, manter diálogo e identificar vozes.

“Hoje em dia já conseguimos fazer com que a máquina perceba alguma coisa em domínios limitados”, disse, exemplificando: “se o computador tem que marcar um horário e sugere uma hora, consegue compreender uma resposta simples, mas se a resposta for algo como +a essa hora tenho uma reunião, o computador já não consegue extrair dessa informação o +não”.

Mas um dos principais entraves à “aprendizagem” do computador é a dificuldade em “lidar com a conversa espontânea das pessoas, com as suas hesitações ou o voltar atrás nas conversas”, referiu, acrescentando que também já existem os “contadores de histórias”, que são computadores que conseguem fazer vozes de pessoas, mas ainda não conseguem transmitir emoções nem eliminar totalmente o som de sintetizador.

Contudo, é com relativa facilidade que já se consegue fazer com que o computador reproduza a voz de uma pessoa e, consequentemente, “pô-la a dizer aquilo que não disse”, afirmou Isabel Trancoso, adiantando porém que ainda não se eliminou totalmente a artificialidade do som.

A especialista considera que este é já um grande progresso e reconhece que no futuro “poderá ter implicações em termos de segurança”.

“As aplicações deste tipo de tecnologia são inúmeras, podendo ter implicações em termos de segurança, como o reconhecimento de vozes à entrada de edifícios ou ao telefone”.

Também as investigações judiciais deverão ser mais fáceis no futuro, quando por computador se conseguir decifrar se a voz de um alegado arguido em gravações telefónicas feitas pela polícia corresponde de facto à pessoa, explicou.

Fora do âmbito judicial, um computador que fale e entenda será uma mais-valia não só na área da segurança, mas para os deficientes, para os advogados – fazendo a transcrição automática dos testemunhos todos -, para as telecomunicações ou para qualquer empresa – com aplicações de ditado, resultados de análises ou exames médicos, acrescentou.

“Uma aplicação que está muito na berra é a utilização do computador para fazer actas de reunião”, o que ainda não é fácil, pois se cada pessoa tiver um microfone são muitas vozes ao mesmo tempo e há sempre ruídos de fundo que o computador não vai conseguir filtrar e descodificar.

Mas para Isabel Trancoso, “o grande sonho, que ainda se está muito longe de atingir, é poder falar em português com um computador e este traduzir para qualquer outra língua, exactamente com a mesma voz”.

Esta é já a sexta conferência mundial Interspeech, mas a primeira em Portugal e a “maior de sempre, com cerca de 800 artigos submetidos e 1300 participantes”.

A decorrer no Centro Cultural de Belém, a Interspeech vai reunir os melhores cientistas que trabalham em todo o mundo para a utilização da voz na comunicação com os computadores e abordar temas como diálogo entre pessoas e máquinas, ambientes ruidosos, dispositivos portáteis e de “mãos-livres”, computação afectiva, tradução fala-fala, dar voz aos cidadãos com necessidades especiais, ensino assistido da língua e telecomunicações.

Para a organização desta conferência, que conta com o alto patrocínio da Presidência da República, juntaram-se os principais laboratórios que desenvolvem actividades nesta área em Portugal: Laboratório de sistemas de Língua Falada do INESC, onde participa o Instituto Superior Técnico, o Instituto de Engenharia Electrónica e Telemática de Aveiro, a Faculdade de Engenharia da Universidade do Porto, o pólo de Coimbra do Instituto de Telecomunicações e o Centro de Linguística da Universidade de Lisboa.

FONTE: Agência Lusa (Notícia SIR-7290741)

Os comentarios estão fechados.

Artigos relacionados

    Investigar em RSS