Какво е Apache Hadoop?

Apache Hadoop е името на набор от алгоритми за големи данни, разпределено съхранение и софтуер за разпределена обработка, създаден от Apache Software Foundation. Той е проектиран да поддържа приложения с голям обем данни; автоматично обработване на хардуерни повреди без загуба на сервиз.

Hadoop използва разпределена файлова система, известна като HDFS, и софтуер за обработка на масиви от данни, известни като MapReduce. Изключително големите файлове се разделят на парчета, обикновено 64 или 128 MB всяка. Софтуерът е написан предимно на Java, с код на по-ниско ниво, написан на C.

Apache сървър, големи данни, услуга, софтуерни термини