Zum Inhalt

2. Evolution of Neural Networks to Large Language Models

  • 2023
  • OriginalPaper
  • Buchkapitel
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Dieses Kapitel befasst sich mit der faszinierenden Entwicklung von Sprachmodellen, von frühen statistischen Methoden wie n-grammen und versteckten Markov-Modellen bis hin zur bahnbrechenden Transformer-Architektur und großen Sprachmodellen (LLMs). Er diskutiert die Entwicklung neuronaler Netzwerke, insbesondere rezidivierender neuronaler Netzwerke (RNNs), Langzeit-Kurzzeitgedächtnis-Netzwerke (LSTM) und gated recurrent units (GRUs), und wie sie die Verarbeitung natürlicher Sprache (NLP) revolutioniert haben. Das Kapitel untersucht auch den Aufstieg aufmerksamkeitsbasierter Modelle, beispielhaft am Transformer, der die Effizienz und Leistung von Sprachmodellen deutlich verbessert hat. Darüber hinaus werden die Fähigkeiten und Herausforderungen großer Sprachmodelle wie GPT-3, BERT und T5 hervorgehoben, die die Grenzen dessen, was künstliche Intelligenz beim Verständnis und der Erzeugung menschlicher Sprache erreichen kann, erweitert haben. Diese Reise durch die Evolution von Sprachmodellen bietet einen faszinierenden Blick auf die technologischen Fortschritte, die den Bereich der NLP geprägt und den Weg für die Entwicklung hoch entwickelter KI-Systeme geebnet haben, die in der Lage sind, menschliche Sprache auf einem nie dagewesenen Niveau zu verstehen und zu erzeugen.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Titel
Evolution of Neural Networks to Large Language Models
Verfasst von
Akshay Kulkarni
Adarsha Shivananda
Anoosh Kulkarni
Dilip Gudivada
Copyright-Jahr
2023
Verlag
Apress
DOI
https://doi.org/10.1007/978-1-4842-9994-4_2
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, NTT Data/© NTT Data, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Kumavision/© Kumavision, Noriis Network AG/© Noriis Network AG, WSW Software GmbH/© WSW Software GmbH, tts GmbH/© tts GmbH, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG