Skip to main content

2016 | OriginalPaper | Buchkapitel

Named Entity Recognition from Arabic-French Herbalism Parallel Corpora

verfasst von : Mohamed Aly Fall Seideh, Hela Fehri, Kais Haddar

Erschienen in: Automatic Processing of Natural-Language Electronic Texts with NooJ

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

With the adverse health effects of chemical drugs and antibiotics, herbal medicine has been a resurgence of interest in recent years. Thus, the use of medicinal plants is being largely considered as an effective and lucrative treatment, especially in Asia and Africa. The objective of this work is to achieve an identification system of medicinal plants names from French-Arabic parallel corpora. Corpora are formed by several texts composed from the multilingual encyclopedia Wikipedia. The identification of Named Entities is realized by several types of patterns. These patterns are represented by a set of transducers. The prototype is implemented in NooJ linguistic platform using a set of morphological and syntactic grammars. This prototype is experimented on a French-Arabic parallel corpora collected from Wikipedia. The obtained results are promising given the measures values.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Allauzen, A., Wisniewski, G.: Modèles discriminants pour l’alignement mot à mot. TAL 50(3), 173–203 (2009) Allauzen, A., Wisniewski, G.: Modèles discriminants pour l’alignement mot à mot. TAL 50(3), 173–203 (2009)
2.
Zurück zum Zitat Ameh, S.J., Obodozie, O.O., Babalola, P.C., Gamaniel, K.S.: Medical herbalism and herbal clinical research: a global perspective. Br. J. Pharm. Res. 1(4), 99–123 (2011)CrossRef Ameh, S.J., Obodozie, O.O., Babalola, P.C., Gamaniel, K.S.: Medical herbalism and herbal clinical research: a global perspective. Br. J. Pharm. Res. 1(4), 99–123 (2011)CrossRef
3.
Zurück zum Zitat Bodenreider, O., Zweigenbaum, P.: Identifying proper names in parallel medical terminologies. Stud. Health Technol. Inform. 77, 443–447 (2000) Bodenreider, O., Zweigenbaum, P.: Identifying proper names in parallel medical terminologies. Stud. Health Technol. Inform. 77, 443–447 (2000)
4.
Zurück zum Zitat Daille, B., Gaussier, E., Lange, J.-M.: Towards automatic extraction of monolingual and bilingual terminology. In: Proceedings of the 15th International Conference on Computational Linguistics (COLING 1994), pp. 515–521 (1994) Daille, B., Gaussier, E., Lange, J.-M.: Towards automatic extraction of monolingual and bilingual terminology. In: Proceedings of the 15th International Conference on Computational Linguistics (COLING 1994), pp. 515–521 (1994)
5.
Zurück zum Zitat Debili, F., Zibi, A.: Les dépendances syntaxiques au service de l’appariement des mots. In: Actes du 10ème Congrès Reconnaissance des Formes et Intelligence Artificielle (RFIA 1996) (1996) Debili, F., Zibi, A.: Les dépendances syntaxiques au service de l’appariement des mots. In: Actes du 10ème Congrès Reconnaissance des Formes et Intelligence Artificielle (RFIA 1996) (1996)
6.
Zurück zum Zitat Deléger, L., Merkel, M., Zweigenbaum, P.: Translating medical terminologies through word alignement in parralel text corpora. J. Biomed. Inform. 42, 692–701 (2009)CrossRef Deléger, L., Merkel, M., Zweigenbaum, P.: Translating medical terminologies through word alignement in parralel text corpora. J. Biomed. Inform. 42, 692–701 (2009)CrossRef
7.
Zurück zum Zitat Fehri, H.: Reconnaissance automatique des entités nommées arabes et leur traduction vers le français. Ph.D. thesis, Sfax University (2012) Fehri, H.: Reconnaissance automatique des entités nommées arabes et leur traduction vers le français. Ph.D. thesis, Sfax University (2012)
8.
Zurück zum Zitat Gledhill, D.: The Names of Plants, 4th edn. Cambridge University Press, Cambridge (2008)CrossRef Gledhill, D.: The Names of Plants, 4th edn. Cambridge University Press, Cambridge (2008)CrossRef
9.
Zurück zum Zitat Goldman, J.-P., Scherrer, Y.: Création automatique de dictionnaires bilingues d’entités nommés grace à Wikipédia. Nouveaux Cahiers de Linguistique Française 30, 213–227 (2012) Goldman, J.-P., Scherrer, Y.: Création automatique de dictionnaires bilingues d’entités nommés grace à Wikipédia. Nouveaux Cahiers de Linguistique Française 30, 213–227 (2012)
10.
Zurück zum Zitat Hoffmann, D.: Medical Herbalism: The Science And Practice of Herbal Medicine. Haling Arts Press, Rochester (2003) Hoffmann, D.: Medical Herbalism: The Science And Practice of Herbal Medicine. Haling Arts Press, Rochester (2003)
11.
Zurück zum Zitat Nadeau, N., Sekine, S.: A survey of named entity recognition and classification. In: Sekine, S., Ranchhod, E. (eds.) Named Entities: Recognition, Classification and Use. John Benjamins publishing company, pp. 3–28 (2009) Nadeau, N., Sekine, S.: A survey of named entity recognition and classification. In: Sekine, S., Ranchhod, E. (eds.) Named Entities: Recognition, Classification and Use. John Benjamins publishing company, pp. 3–28 (2009)
12.
Zurück zum Zitat Nothan, J., Ringland, N., Radford, W., Murphy, T., Curran, J.R.: Learning multilingual named entity recognition from Wikipedia. Artif. Intell. 194, 151–175 (2013)MathSciNetCrossRefMATH Nothan, J., Ringland, N., Radford, W., Murphy, T., Curran, J.R.: Learning multilingual named entity recognition from Wikipedia. Artif. Intell. 194, 151–175 (2013)MathSciNetCrossRefMATH
13.
Zurück zum Zitat Ozdowska, S., Claveau, V.: Inférence de règles de propagation syntaxique pour l’alignement de mots. TAL 47(1), 167–186 (2006). ATALA Ozdowska, S., Claveau, V.: Inférence de règles de propagation syntaxique pour l’alignement de mots. TAL 47(1), 167–186 (2006). ATALA
14.
Zurück zum Zitat Rose Lim-Cheng, N., Co, J.R.C., Gaudiel, C.H.S., Umadac, D.F., Victor, N.L.: Semi-automatic population of ontology of philippine medicinal plants from on-line text. Presented at the DLSU Research Congress, De La Salle University, Manila, Philippines, 6–8 March 2014 Rose Lim-Cheng, N., Co, J.R.C., Gaudiel, C.H.S., Umadac, D.F., Victor, N.L.: Semi-automatic population of ontology of philippine medicinal plants from on-line text. Presented at the DLSU Research Congress, De La Salle University, Manila, Philippines, 6–8 March 2014
15.
Zurück zum Zitat Semmar, N., Saadane, H.: Etude de l’impact de la translittération de noms propres sur la qualité de l’alignement de mots à partir de corpus paralléles français-arabe. In: 21iéme Traitement Automatique des Langues Naturelles, Marseille, pp. 268–279 (2014) Semmar, N., Saadane, H.: Etude de l’impact de la translittération de noms propres sur la qualité de l’alignement de mots à partir de corpus paralléles français-arabe. In: 21iéme Traitement Automatique des Langues Naturelles, Marseille, pp. 268–279 (2014)
16.
Zurück zum Zitat Semmar, N., Servan, C., De Chalendar, G., Le Ny, B.: A hybrid word alignment approach to improve translation lexicons with compound words and idiomatic expressions. In: Proceedings of the 32nd Translating and the Computer Conference, England (2010) Semmar, N., Servan, C., De Chalendar, G., Le Ny, B.: A hybrid word alignment approach to improve translation lexicons with compound words and idiomatic expressions. In: Proceedings of the 32nd Translating and the Computer Conference, England (2010)
17.
Zurück zum Zitat Shaalan, K.: A survey of Arabic named entity recognition and classification. Comput. Linguist. 40(2), 469–510 (2014)CrossRef Shaalan, K.: A survey of Arabic named entity recognition and classification. Comput. Linguist. 40(2), 469–510 (2014)CrossRef
18.
Zurück zum Zitat Silberztein, M.: NooJ: a Linguistic annotation system for corpus processing. In: Proceedings of the Conference on Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing, Vancouver, British Columbia, Canada, 6–8 October 2005 Silberztein, M.: NooJ: a Linguistic annotation system for corpus processing. In: Proceedings of the Conference on Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing, Vancouver, British Columbia, Canada, 6–8 October 2005
19.
Zurück zum Zitat Sokolova, M., Lapalme, G.: A systematic analysis of performance measures for classification tasks. Inf. Process. Manage. 45, 427–437 (2009)CrossRef Sokolova, M., Lapalme, G.: A systematic analysis of performance measures for classification tasks. Inf. Process. Manage. 45, 427–437 (2009)CrossRef
Metadaten
Titel
Named Entity Recognition from Arabic-French Herbalism Parallel Corpora
verfasst von
Mohamed Aly Fall Seideh
Hela Fehri
Kais Haddar
Copyright-Jahr
2016
DOI
https://doi.org/10.1007/978-3-319-42471-2_17