Un experimento de extracción de terminología utilizando algoritmos estadísticos supervisados
Palabras clave:
Extração de Terminologia, Análise Estatística de Textos Especializados, Aprendizado de Máquina, Terminografia Computacional, Conhecimento ImplícitoResumen
Este artigo descreve uma metodologia para a extração automática de candidatos a termos baseada em técnicas de análise estatística de textos. Diferentemente da maioria dos extratores de terminologia que aparecem na literatura sobre o assunto, a nossa proposta não integra qualquer conhecimento explícito sobre a língua ou o domínio que está sendo analisado. Este algoritmo extrai as informações diretamente dos dados analisados, por meio de uma fase de treinamento na qual um usuário “ensina” os exemplos de unidades terminológicas (uma lista de termos validados) e unidades não terminológicas (uma coleção de textos não especializados). A partir destes exemplos, o algoritmo realiza uma abstração que permite distinguir novas unidades terminológicas em novos textos. A avaliação de desempenho deste algoritmo em termos de precisão e cobertura demonstra qualidade suficiente para ser útil no processamento de terminologia. a principal vantagem da nossa proposta é a sua fácil adaptação a novas línguas e domínios de especialidade, tornando uma ferramenta adequada para línguas com poucos recursos.Descargas
Los datos de descargas todavía no están disponibles.
Descargas
Publicado
08-06-2011
Cómo citar
Nazar, R., & Cabré, M. T. (2011). Un experimento de extracción de terminología utilizando algoritmos estadísticos supervisados. Debate Terminológico, (07), 36–55. Recuperado a partir de https://seer.ufrgs.br/index.php/riterm/article/view/20712
Número
Sección
Artículos Sección Libre
Licencia
Derechos de autor 2011 Debate Terminológico

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.