EELO [N+Sig:ms] SMELL
Português
label@label.ist.utl.pt LabEL® - Laboratório de Engenharia da Linguagem
 

Formação -- Teses de Mestrado -- Paula Fonseca Carvalho

Paula Fonseca Carvalho
Gramáticas de resolução de ambiguidades resultantes da homografia de nomes e adjectivos
Mestrado em Linguística (Novas Tecnologias. Aplicações ao Estudo e Ensino do Português), FLUL.

Um dos problemas que se coloca no âmbito do tratamento automático das línguas naturais é a ambiguidade, provocada, a nível lexical, pela homografia existente entre palavras que pertencem a diferentes categorias gramaticais. Essa homografia aumenta no caso das línguas que, como o português, têm um sistema morfológico muito desenvolvido.

Neste trabalho, procuraremos resolver a homografia existente entre formas que tanto podem ser nomes como adjectivos, muito frequente em português, elaborando gramáticas que permitam identificar, de um modo tão eficaz quanto possível, se uma dada forma pertence a uma ou a outra categoria. Essas gramáticas serão baseadas em autómatos de estados finitos, instrumentos recentemente reconhecidos como muito adequados ao processamento das línguas naturais (Emmanuel Roche e Yves Schabes (1997)). O tipo de autómatos a desenvolver são os utilizados pelo Intex, um sistema de processamento de língua natural, desenvolvido no LADL por Max Silberztein para analisar textos escritos.

O quadro teórico que adoptaremos será o do léxico-gramática, definido por M. Gross (1975, 1981), o qual contempla a estreita relação existente entre as várias componentes da gramática, nomeadamente entre o léxico, a sintaxe e a semântica, assumindo-se, assim, que a unidade de estudo relevante é não a palavra, mas a frase. Os princípios teóricos que orientam as descrições do léxico-gramática são os da gramática transformacional de Harris (1964, 1968, 1976, 1991); esses princípios visam o estabelecimento de relações de equivalência entre conjuntos de frases elementares, que apresentam variações regulares, mas cujo significado é basicamente idêntico.