Decomposing and regenerating syntactic trees
| Authors | |
|---|---|
| Supervisors | |
| Cosupervisors | |
| Award date | 12-01-2012 |
| ISBN |
|
| Number of pages | 187 |
| Publisher | Amsterdam: Institute for Logic, Language and Computation |
| Organisations |
|
| Abstract |
Federico Sangati onderzocht het leren van syntactische boomstructuren aan de hand van generalisaties over geannoteerde corpora. Hij richtte zich op verschillende probabilistische modellen, met drie verschillende representaties. Sangati formuleerde een algemeen kader (framework) voor het definiƫren van generatieve modellen van syntaxis. In elk model vallen de syntactische bomen uiteen in elementaire constructies die opnieuw gecombineerd kunnen worden om nieuwe syntactische structuren te genereren. Voor het leren van zinsstructuren introduceert Sangati een nieuwe methode van Data-Georiƫnteerd Ontleden (Data-Oriented Parsing). Hierbij worden constructies van willekeurige grootte gebruikt als bouwstenen van het model. Om de grammatica te beperken tot een kleine, maar representatieve verzameling van constructies worden echter alleen constructies die meerdere keren voorkomen gebruikt als verzameling van voorbeelden.
|
| Document type | PhD thesis |
| Note | ILLC dissertation series no. DS 2012-01 Research conducted at: Universiteit van Amsterdam |
| Language | English |
| Permalink to this page | |