nach oben

Erschienen in:

2014 | OriginalPaper | Buchkapitel

Extracting the Translation of Anime Titles from Web Corpora Using CRF

verfasst von : Maiko Yamazaki, Hajime Morita, Kanako Komiya, Yoshiyuki Kotani

Erschienen in: Knowledge-Based Software Engineering

Verlag: Springer International Publishing

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

Unknown words whose translation is not listed in general dictionaries, have been a problem in cross-language information retrieval and machine translation. Since the new terms are created one after the other, it is difficult to cover all such terms using general bilingual dictionaries. Therefore, researches on automatic extraction of translations for unknown words have been performed for the purpose of building a bilingual dictionary at low cost using Web corpora. In this paper, we focus on anime titles; they are commercially important, and propose a method to extract Japanese candidate translations corresponding to the English anime titles using Conditional Random Fields (CRF). We used transliteration features as well as features of bag of words, part of speech, and so on because we focused on the fact that when the Japanese anime titles were translated into English, they were transliterated in many cases. The experiments were performed using one hundred Web pages at most collected from the search engine, whose queries were Japanese-English anime title pairs extracted from Wikipedia. The results showed that the number of acquired titles significantly increased when the transliteration features were used.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Vorheriges Kapitel Thematic Clustering Methods Applied to News Texts Analysis

Nächstes Kapitel Method of Ontology-Based Extraction of Physical Effect Description from Russian Text

Titel: Extracting the Translation of Anime Titles from Web Corpora Using CRF
verfasst von: Maiko Yamazaki
Hajime Morita
Kanako Komiya
Yoshiyuki Kotani
Verlag: Springer International Publishing
Buch: Knowledge-Based Software Engineering
Print ISBN: 978-3-319-11853-6

Electronic ISBN: 978-3-319-11854-3

Copyright-Jahr: 2014
DOI: https://doi.org/10.1007/978-3-319-11854-3_26

Springer Professional

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"