бесплатно с городских телефонов Украины
Киев | 044 392-73-56 |
Харьков | 057 728-49-18 |
Днепр | 056 790-86-00 |
Одесса | 048 734-56-54 |
Львов | 032 229-58-50 |
Николаев | 051 270-12-63 |
Полтава | 053 262-53-74 |
Запорожье | 061 228-69-91 |
Apache Hadoop является широко используемым в ИТ-индустрии инструментом с открытым исходным кодом,предназначенным для обработки больших данных.
Перед выполнением инструкции рекомендуется создать не root пользователя с доступом к sudo (а перед этим подключиться к серверу по SSH).
В инструкции используется текстовый редактор nano, для установки которого требуется выполнить команду:
yum install nano
Обновляем систему до последнего стабильного состояния при помощи команды:
sudo yum install epel-release -y
Нажимаем Enter.
и команды:
sudo yum update -y
Нажимаем Enter. Обновление может занять несколько минут.
Устанавливаем OpenJDK 8 JRE с помощью YUM:
sudo yum install -y java-1.8.0-openjdk
Нажимаем Enter. Если запрашивает пароль, ввести его.
Проверяем установку OpenJDK 8 JRE:
java -version
Нажимаем Enter.
Загружаем архив Hadoop:
wget http://apache.ip-connect.vn.ua/hadoop/common/hadoop-2.7.5/hadoop-2.7.5.tar.gz
Нажимаем Enter.
Загружаем файл контрольной суммы:
wget https://dist.apache.org/repos/dist/release/hadoop/common/hadoop-2.7.5/hadoop-2.7.5.tar.gz.mds
Нажимаем Enter.
Устанавливаем инструмент контрольной суммы:
sudo yum install perl-Digest-SHA
Нажимаем Enter. Потом нажать y и Enter.
Вычисляем значение SHA256 архива Hadoop:
shasum -a 256 hadoop-2.7.5.tar.gz
Нажимаем Enter.
Отображаем содержимое файла hadoop-2.7.5.tar.gz.mds чтобы убедиться, что оба значения SHA256 идентичны:
cat hadoop-2.7.5.tar.gz.mds
Нажимаем Enter.
Извлекаем архив в каталог opt:
sudo tar -zxvf hadoop-2.7.5.tar.gz -C /opt
Нажимаем Enter. Если запрашивает пароль, ввести его
Указываем для Hadoop исходное местоположение Java.
Для этого открываем файл конфигурации среды Hadoop, /opt/hadoop-2.7.5/etc/hadoop/hadoop-env.sh
sudo nano /opt/hadoop-2.7.5/etc/hadoop/hadoop-env.sh
Нажимаем Enter.
Находим строку:
export JAVA_HOME=${JAVA_HOME}
И меняем ее на стороку:
export JAVA_HOME=$(readlink -f /usr/bin/java | sed "s:bin/java::")
Сохраняем изменение в файле, нажав сочетание клавиш Ctrl+x , затем клавишу y и затем клавишу Enter.
Добавляем путь к Hadoop к PATH переменной окружения.
Выполняем команду:
echo "export PATH=/opt/hadoop-2.7.5/bin:$PATH" | sudo tee -a /etc/profile
Нажимаем Enter.
И команду:
source /etc/profile
Нажимаем Enter.
При помощи встроенного примера Проверяем установки Hadoop.
Подготавливаем источник данных.
Команды:
mkdir ~/source
Нажимаем Enter.
cp /opt/hadoop-2.7.5/etc/hadoop/*.xml ~/source
Нажимаем Enter.
Используем Hadoop вместе с grep для вывода результата:
hadoop jar /opt/hadoop-2.7.5/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.5.jar grep ~/source ~/output 'principal[.]*'
Нажимаем Enter.
Смотрим содержимое выходных файлов:
cat ~/output/*
Нажимаем Enter.
Теперь Hadoop готов к работе.
См.также:
Установка Hadoop