Skip to main content

2015 | OriginalPaper | Buchkapitel

A Semi-Automatic Word-Level Annotation and Transcription Tool for Spelling Error Categories

verfasst von : L. Linhuber, S. Stüker, R. Lavalley, K. Berkling

Erschienen in: HCI International 2015 - Posters’ Extended Abstracts

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

In order to train and evaluate tools for the automatic transcription of misspelled texts and automatic annotation of over 20 spelling error categories, it is important to create training data. A very large database of children’s freely written text was collected in the past and in this paper we describe the tool that we have developed in order to manually transcribe and annotate the data. The manual transcription comprises the reconstruction of the orthographically correct word sequence. Annotation is performed on a per-word basis with respect to committed (child spelling) and potential (correct word) spelling error categories. The tool supports human transcribers by suggesting automatically generated annotations. Consistent annotations are propagated and data is presented to the user in a sorted manner to minimize human effort. The tool has been implemented as a web application that makes use of PHP on the server side and a lightweight Java GUI on the client side. The annotated data is stored in a custom made XML schema.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
LV (length vowel) denotes the notation of length for vowels through the use of the letter \(<\)h\(>\), preceding a consonant.
 
Literatur
1.
Zurück zum Zitat Berkling, K., Fay, J., Ghayoomi, M., Hein, K., Lavalley, R., Linhuber, L., Stüker, S.: A database of freely written texts of german school students for the purpose of automatic spelling error classification. In: The 9th Edition of the Language Resources and Evaluation Conference (LREC 2014), Reykjavik, 26–31 May 2014 Berkling, K., Fay, J., Ghayoomi, M., Hein, K., Lavalley, R., Linhuber, L., Stüker, S.: A database of freely written texts of german school students for the purpose of automatic spelling error classification. In: The 9th Edition of the Language Resources and Evaluation Conference (LREC 2014), Reykjavik, 26–31 May 2014
2.
Zurück zum Zitat Berkling, K., Fay, J., Stüker, S.: Speech technology-based framework for quantitative analysis of german spelling errors in freely composed childrens texts. In: The 2011 Workshop of the ISCA Special Interest Group on Speech and Language Technology in Education (SLaTE 2011), Venice, August 2011 Berkling, K., Fay, J., Stüker, S.: Speech technology-based framework for quantitative analysis of german spelling errors in freely composed childrens texts. In: The 2011 Workshop of the ISCA Special Interest Group on Speech and Language Technology in Education (SLaTE 2011), Venice, August 2011
3.
Zurück zum Zitat Bos, W.: IGLU: Einige Länger der BRD im Nationalen und Internationalen Vergleich. Waxmann Verlag, Münster (2004) Bos, W.: IGLU: Einige Länger der BRD im Nationalen und Internationalen Vergleich. Waxmann Verlag, Münster (2004)
4.
Zurück zum Zitat Fay, J.: Kompetenzfacetten in der Rechtschreibdiagnostik. Rechtschreibleistung im Test und im freien Text. In: Bermerich-Vos, A. (ed.) Didaktik Deutsch: Symposium Deutschdidaktik, vol. 29, pp. 15–36. Schneider Verlag, Germany (2010) Fay, J.: Kompetenzfacetten in der Rechtschreibdiagnostik. Rechtschreibleistung im Test und im freien Text. In: Bermerich-Vos, A. (ed.) Didaktik Deutsch: Symposium Deutschdidaktik, vol. 29, pp. 15–36. Schneider Verlag, Germany (2010)
5.
Zurück zum Zitat Fay, J., Berkling, K., Stüker, S.: Automatische Analyse von Rechtschreibfähigkeit auf Basis von Speech-Processing-Technologien. In: Didaktik Deutsch, Halbjahresschrift für die Didaktik der deutschen Sprache und Literatur, vol. 19(33) (2012) Fay, J., Berkling, K., Stüker, S.: Automatische Analyse von Rechtschreibfähigkeit auf Basis von Speech-Processing-Technologien. In: Didaktik Deutsch, Halbjahresschrift für die Didaktik der deutschen Sprache und Literatur, vol. 19(33) (2012)
6.
Zurück zum Zitat Stüker, S., Fay, J., Berkling, K.: Towards context-dependent phonetic spelling error correction in childrens freely composed text for diagnostic and pedagogical purposes. In: Proceedings of the 12th Annual Conference of the International Speech Communication Association (INTERSPEECH 2011), Florence, August 2011 Stüker, S., Fay, J., Berkling, K.: Towards context-dependent phonetic spelling error correction in childrens freely composed text for diagnostic and pedagogical purposes. In: Proceedings of the 12th Annual Conference of the International Speech Communication Association (INTERSPEECH 2011), Florence, August 2011
Metadaten
Titel
A Semi-Automatic Word-Level Annotation and Transcription Tool for Spelling Error Categories
verfasst von
L. Linhuber
S. Stüker
R. Lavalley
K. Berkling
Copyright-Jahr
2015
Verlag
Springer International Publishing
DOI
https://doi.org/10.1007/978-3-319-21380-4_100

Neuer Inhalt