Skip to main content

2018 | OriginalPaper | Buchkapitel

82. Data Retrieval and Parsing of Form 4 from the Edgar System using Multiple CPUs

verfasst von : Raja H. Singh, Nolan Burfield, Frederick Harris Jr.

Erschienen in: Information Technology - New Generations

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

In this paper we present a parallel system that retrieves and parses Form 4 documents from the Securities and Exchange Commission’s Electronic Data Gathering, Analysis and Retrieval database (EDGAR). This information is very important for investors looking at insider trading information to make investment decisions. However, the information’s usefulness is inversely related to the time it takes to retrieve and analyze the information. A sequential system is slow due to the latency associated with the retrieval and parsing of the Form 4s, which on average exceeds 1000 per day. By making the retrieval and parsing of Form 4s parallel we were able to attain the max speed up of 20x, resulting in parsing of a daily index with 1000 forms in under 30 minutes instead of 9 hours it takes utilizing a single processor.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat What We Do. SEC.gov. Web. 05 Apr. 2016. What We Do. SEC.gov. Web. 05 Apr. 2016.
4.
Zurück zum Zitat García, D., & Norli, Ø. (2012). Crawling EDGAR, The Spanish Review of Financial Economics, 10(1), 1–10.CrossRef García, D., & Norli, Ø. (2012). Crawling EDGAR, The Spanish Review of Financial Economics, 10(1), 1–10.CrossRef
5.
Zurück zum Zitat Lyon, D. A. (2008). Multi-threaded data mining of EDGAR CIKs (Central Index Keys) from ticker symbols.In 2008 I.E. International Symposium on Parallel and Distributed Processing. Lyon, D. A. (2008). Multi-threaded data mining of EDGAR CIKs (Central Index Keys) from ticker symbols.In 2008 I.E. International Symposium on Parallel and Distributed Processing.
Metadaten
Titel
Data Retrieval and Parsing of Form 4 from the Edgar System using Multiple CPUs
verfasst von
Raja H. Singh
Nolan Burfield
Frederick Harris Jr.
Copyright-Jahr
2018
DOI
https://doi.org/10.1007/978-3-319-54978-1_82