NashTech

Ermöglicht Huawei die Implementierung verschiedener Funktionalitäten und die Unterstützung der Integration von Presto und Hive in CarbonData

Ermöglicht Huawei die Implementierung verschiedener Funktionalitäten und die Unterstützung der Integration von Presto und Hive in CarbonData

Einführung

NashTech arbeitete mit Huawei zusammen, um ein Dateiformat zu entwickeln, das schneller und effizienter bei der Verarbeitung und Abfrage von Big Data ist. Jetzt können Huawei-Kunden ihr System durch die Nutzung der Funktionen von CarbonData beschleunigen.

Über Huawei

Apache CarbonData ist ein indiziertes kolumnares Datenformat für schnelle Analysen auf Big-Data-Plattformen, z. B. Apache Hadoop, Apache Spark usw. NashTech ermöglicht es Huawei, mit ihnen zusammenzuarbeiten, um verschiedene Funktionalitäten oder Integrationsunterstützung mit verschiedenen Technologien wie Presto und Hive in CarbonData zu implementieren.

Die Herausforderung

Huawei möchte einen Bereich erforschen, in dem Backend, Frontend und kontinuierliche Integration die Abwärtskompatibilität älterer Versionen sicherstellen, wenn neuere Versionen häufig ausgerollt werden. NashTech arbeitete mit dem Huawei-Team zusammen, um CarbonData dabei zu helfen, von einem Inkubationsprojekt zu einem Apache-lizenzierten Projekt zu werden.

knoldus-carbon-diagram-1

Die Lösung

NashTech arbeitete eng mit dem Huawei-Team zusammen und half bei der Entwicklung der entscheidenden Funktionen, von denen einige unten aufgeführt sind:

  • Entwicklung eines Tools zur Erstellung von Wörterbüchern für CarbonData.
  • Verbesserte Kosteneffizienz: Durch das automatisierte Cluster-Management konnten die Betriebskosten um mehr als 50 % gesenkt werden.
  • CarbonData-Integration mit Presto, Hive, Flink und S3-Technologien.
  • Einrichten der kontinuierlichen Integration über Jenkins.
  • Erstellung eines Tools für Leistungstests zur Durchführung von Benchmarking
  • Null Fehler mit Automatisierungstests erreichen.
  • Entwicklung der Apache CarbonData-Website und deren Pflege.
  • Entwicklung und Erweiterung der Kernpakete von CarbonData.
  • Benchmarking von CarbonData gegenüber verfügbaren Dateiformaten wie Parquet und ORC, gegenüber Frameworks wie Spark, Presto und Impala und gegenüber verschiedenen Speichersystemen wie Hadoop, S3 und Kudu.

NashTech arbeitete mit Huawei zusammen, um ein Dateiformat zu entwickeln, das schneller und effizienter bei der Verarbeitung und Abfrage von Big Data ist. Jetzt können Huawei-Kunden ihr System durch die Nutzung der Funktionen von CarbonData beschleunigen.

Unser Team hat auch ein eigenes Leistungsbenchmarking-Tool für CarbonData entwickelt. Dieses Benchmark-Tool testet die Leistung von CarbonData im Vergleich zu seinen Konkurrenten wie Parquet und ORC Format. Die wichtigsten Funktionen, die das Benchmark-Tool unterstützt, sind folgende:

  • Generierung der TPCH-Benchmarking-Daten in Abhängigkeit von der konfigurationsbedingten Clustergröße.
  • Definition von Workloads als Konfiguration für bestimmte Datensätze.
  • Laden der Daten in allen Formaten in den Hive-Speicher wie CarbonData, Parquet und ORC.
  • Konfigurationsbasiertes Tuning für Spark, das sowohl Parallelisierungseinstellungen als auch die Spark-Konfiguration auf der Grundlage verschiedener Arbeitslasten umfasst.
  • Ausführen der Workloads und Erfassen der Antwortzeit und der Ergebnisse in Bezug auf die Last für alle Formate.
  • Vergleich der Ergebnisse in allen Formaten.
  • Generierung eines Excel-Berichts, der den Vergleich der Ergebnisse sowie Erfolg und Misserfolg der Testdurchführung zeigt.

Das Ergebnis

Dank der schnellen Entwicklung und des prägnanten Codes, den Scala bietet, konnte NashTech das System innerhalb von 4 Monaten in Produktion bringen. Die Warnmeldungen werden nach festgelegten Regeln an verschiedene Bereiche weitergeleitet und erreichen die Mailbox der Verbraucher in Sekundenschnelle, sobald die Nachricht bekannt wird. Das Produkt wird als Teil der Infrastruktur intensiv genutzt.

Weitere Fallstudien lesen

Vom Überwinden von Widrigkeiten zum Reiten der Welle der digitalen Transformation im Bildungssektor

Erfahren Sie, wie NashTech dem Trinity College London hilft, die Welle der digitalen Transformation im Bildungssektor zu reiten

AWS
AWS
Migration und Modernisierung der virtuellen Lernumgebung auf AWS für ein verbessertes Erlebnis

Das migrierte und modernisierte Moodle Infrastruktur bedeutet, dass The Open Die Universität kann nun folgende Vorteile nutzen Cloud-Vorteile.

Ein Einblick in eine einjährige RPA-Reise mit einem führenden digitalen Werbedienst

Ein Einblick in eine einjährige RPA-Reise mit einem führenden Anbieter von digitalen Werbedienstleistungen und -lösungen und wie NashTech ihnen geholfen hat.

Unsere Partnerschaften

Nach oben scrollen
BEISPIEL TITEL
Muster kurz
Musterüberschrift lorem isump
DE FREE WHITEPAPER
Erschließen Sie die Macht des Wissens mit unserem neuen Whitepaper
“Verbesserung der Benutzererfahrung für Produktbesitzer”
KOSTENLOSES WHITEPAPER
Erschließen Sie die Macht des Wissens mit unserem neuen Whitepaper
"Verbesserte Benutzererfahrung für Produktverantwortliche"