Presentation laddar. Vänta.

Presentation laddar. Vänta.

Annoterade satser och platta frasstrukturer för svenska

Liknande presentationer


En presentation över ämnet: "Annoterade satser och platta frasstrukturer för svenska"— Presentationens avskrift:

1 Annoterade satser och platta frasstrukturer för svenska
Johnny Bigert Ola Knutsson Viggo Kann Jonas Sjöbergh

2 Bygge av svensk trädbank
SUC - korrekt, tillgängligt, balanserat Majoritetsröstning med befintliga verktyg för frasstrukturer - halvautomatik Manuell annotering / manuell rättning?

3 Utvärdering Manuell utvärdering: små ändringar - mycket arbete
Automatisk utvärdering - individuella delars inverkan på prestanda

4 Detektion av svåra stavfel
Hybridmetod: Statistisk/automatisk del Frasidentifiering - manuella regler Exempel på feltyper: Stavfel resulterande i befintliga ord Saknade ord

5 Utvärdering av hybrid Vi påverkas av fel i de olika modulerna:
Tokenisering, taggning, frasidentifiering Hur bra kan metoden bli med perfekt data (maxprestanda)?

6 Utvärdering av hybrid Robusthet:
Vad blir effekten om ingen hänsyn tas till kongruens? Taggningsfel, fritext innehåller fel Svåra undantag för NP-kongruens i svensk grammatik Sämre prestanda med kongruens i NP

7 Diskussion Manuell annotering / manuell rättning? On-line, Annotate (DFKI)? SUC? Detaljnivå på gemensamt format? Startdatum?


Ladda ner ppt "Annoterade satser och platta frasstrukturer för svenska"

Liknande presentationer


Google-annonser