label@label.ist.utl.pt
|
LabEL® - Laboratório de Engenharia da Linguagem |
Investigação
O trabalho de investigação desenvolvido no LabEL tem duas componentes distintas
que se complementam: por um lado, a de construção
de recursos linguísticos fundamentais (dicionários e gramáticas
electrónicos), e, pelo outro, a de implementação de ferramentas
informáticas que permitam manipular (construir, rever, melhorar) esses dados e
aplicá-los a textos escritos de forma a extrair destes unidades de significado.
Ao nível dos
dados linguísticos têm
vindo a ser construídos:
- Dicionários electrónicos de palavras simples e compostas que incluem
léxico geral com elevado grau de cobertura lexical e de granularidade
(precisão da informação linguística associada às
entradas lexicais) e léxicos mais específicos: siglas, topónimos,
nomes de instituições, nomes próprios, expressões
numéricas, etc.
- Fragmentos importantes da gramática do Português: (i)
gramáticas locais para o reconhecimento automático de combinações
de palavras, fixas e semi-fixas; (ii) gramáticas para analisar e
etiquetar predicados verbais complexos; (iii) gramáticas para
resolver ambiguidades lexicais, e etiquetar as palavras desambiguadas. Foi igualmente
estudada e formalizada a estrutura argumental de cerca de 4.000 verbos, embora estes
dados ainda não possam ser utilizados em análise de texto de forma
automática (trabalho em curso).
No que diz respeito às
ferramentas
informáticas, tem sido desenvolvido o sistema LABEL-T que é
composto por vários módulos de:
- flexão de dicionários de palavras simples e compostas
- consulta lexical de palavras simples e compostas
- indexação automática de texto
- construção de concordâncias
- análise das redes argumentais dos verbos
A fim de verificar a adequação dos
recursos
linguísticos ao funcionamento real da língua, além de serem realizadas
experiências em «corpora» de grandes dimensões com o sistema LABEL-T
são igualmente realizadas experiências com o sistema
Unitex
(desenvolvido por
S. Paumier)e com o sistema
INTEX
(desenvolvido por
M. Silberztein).
Estes recursos são ainda utilizados pelo sistema
Glossanet
(desenvolvido por
C. Fairon) para pesquisa de
informação na Internet.H
Parte destas actividades de investigação está enquadrada em
Projectos nacionais e internacionais,
apoiados por diversas Instituições.