<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>ジャナ・ビジネス・コンサルティング &#187; hadoop</title>
	<atom:link href="http://www.janabiz.com/category/hadoop/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.janabiz.com</link>
	<description>新聞、電子出版、Webシステム開発 SAP ERP開発 人材派遣 Java Android プログラマ学校</description>
	<lastBuildDate>Sat, 04 Mar 2023 03:22:06 +0000</lastBuildDate>
	<language>en-US</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.5.1</generator>
		<item>
		<title>Hadoop-2.2.10 Single nodeのセットアップ</title>
		<link>http://www.janabiz.com/hadoop-single-node-setup/</link>
		<comments>http://www.janabiz.com/hadoop-single-node-setup/#comments</comments>
		<pubDate>Fri, 03 Jan 2014 11:36:45 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[hadoop]]></category>
		<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://www.janabiz.com/?p=789</guid>
		<description><![CDATA[<p>この文書はHadoopのローカルモードではなく、1機で分散処理環境の設定を説明します。設定後以下のインスタンスを起動します。 プライマリNameNode セカンダリNameNode DataNode ResourceManager NodeManager (MapReduce)HistoryServer 目次 共通 HDFS YARN MapReduce テスト 共通 ◇アカウントの権限 sudo権限を持つアカウントで下記の手順で実行します。環境変数を保つするために、実行アカウントの.bashrcに下記のaliasを追加します。 alias sudo=&#8217;sudo -E&#8217; ◇必要の４つアカウントを作成します hadoop以外のアカウントでは、アカウントを作成するとき、Homeディレクトリを作成しなくてもOKです。 hadoopユーザとグループの作成 分散ファイルシステムサービス管理ユーザ：hdfs リソース管理とノード管理サービスユーザ：yarn MapReduceジョブ履歴管理サービス：mapred sudo adduser hadoop sudo adduser hdfs sudo usermod -G hadoop hdfs sudo adduser mapred sudo usermod -G hadoop mapred sudo adduser yarn sudo usermod -G hadoop yarn ◇作業ディレクトリを作成します mkdir /tmp/work ◇Java JDKをインストール CentOSの場合、Java OpenJDKがすでにインストールされている可能性があります。java -versionで確認できます。この文書ではOracleのjdk-7u45-linux-x64.gzを/tmp/workにダウンロードしてインストールします。 ダウンロード後解凍してインストします。 cd /usr/local tar xvzf /tmp/work/jdk-7u45-linux-x64.gz ln -s jdk1.7.0_45 jdk ◇hadoop-2.2.0をダウロードして「/」に解凍します cd /tmp/work wget http://ftp.tsukuba.wide.ad.jp/software/apache/hadoop/common/stable2/hadoop-2.2.0.tar.gz cd / tar xvzf /tmp/hadoop-2.2.0.tar.gz chown -R root:hadoop hadoop-2.2.0 ln -s /hadoop-2.2.0 hadoop ◇環境変数の設定 各アカウントに環境変数をそれぞれ追加するより、/etc/profileに追加すると便利です。 #java jdk home export JAVA_HOME=/usr/local/jdk #hadoop environment export HADOOP_PREFIX=/hadoop export HADOOP_MAPRED_HOME=$HADOOP_PREFIX export HADOOP_COMMON_HOME=$HADOOP_PREFIX export HADOOP_HDFS_HOME=$HADOOP_PREFIX export HADOOP_YARN_HOME=$HADOOP_PREFIX export YARN_HOME=$HADOOP_MAPRED_HOME export &#8230; <a href="http://www.janabiz.com/hadoop-single-node-setup/">Continue reading <span class="meta-nav">&#8594;</span></a></p><p>The post <a href="http://www.janabiz.com/hadoop-single-node-setup/">Hadoop-2.2.10 Single nodeのセットアップ</a> appeared first on <a href="http://www.janabiz.com">ジャナ・ビジネス・コンサルティング</a>.</p>]]></description>
				<content:encoded><![CDATA[<div class="content">
この文書はHadoopのローカルモードではなく、1機で分散処理環境の設定を説明します。設定後以下のインスタンスを起動します。</p>
<ul>
<li>プライマリNameNode</li>
<li>セカンダリNameNode</li>
<li>DataNode</li>
<li>ResourceManager</li>
<li>NodeManager</li>
<li>(MapReduce)HistoryServer</li>
</ul>
<h3>目次</h3>
<ul>
<li><a href="#common">共通</a></li>
<li><a href="#hdfs">HDFS</a></li>
<li><a href="#yarn">YARN</a></li>
<li><a href="#mapreduce">MapReduce</a></li>
<li><a href="#test">テスト<a/></li>
<ul>
</div>
<div class="content">
<a name="common"></a></p>
<h3>共通</h3>
<p>◇アカウントの権限</p>
<p>sudo権限を持つアカウントで下記の手順で実行します。環境変数を保つするために、実行アカウントの.bashrcに下記のaliasを追加します。</p>
<div class="div-example">
alias sudo=&#8217;sudo -E&#8217;
</div>
<p>◇必要の４つアカウントを作成します<br />
hadoop以外のアカウントでは、アカウントを作成するとき、Homeディレクトリを作成しなくてもOKです。</p>
<ul>
<li>hadoopユーザとグループの作成</li>
<li>分散ファイルシステムサービス管理ユーザ：hdfs</li>
<li>リソース管理とノード管理サービスユーザ：yarn</li>
<li>MapReduceジョブ履歴管理サービス：mapred</li>
</ul>
<div class="div-example">
sudo adduser hadoop<br />
sudo adduser  hdfs<br />
sudo usermod -G hadoop hdfs<br />
sudo adduser  mapred<br />
sudo usermod -G hadoop mapred<br />
sudo adduser  yarn<br />
sudo usermod -G hadoop yarn
</div>
<p>◇作業ディレクトリを作成します</p>
<div class="div-example">
mkdir /tmp/work
</div>
<p>◇Java JDKをインストール</p>
<p>CentOSの場合、Java OpenJDKがすでにインストールされている可能性があります。java -versionで確認できます。この文書ではOracleのjdk-7u45-linux-x64.gzを/tmp/workにダウンロードしてインストールします。<br />
ダウンロード後解凍してインストします。</p>
<div class="div-example">
cd /usr/local<br />
tar xvzf /tmp/work/jdk-7u45-linux-x64.gz<br />
ln -s jdk1.7.0_45 jdk
</div>
<p>◇hadoop-2.2.0をダウロードして「/」に解凍します</p>
<div class="div-example">
cd /tmp/work<br />
wget http://ftp.tsukuba.wide.ad.jp/software/apache/hadoop/common/stable2/hadoop-2.2.0.tar.gz<br />
cd /<br />
tar xvzf /tmp/hadoop-2.2.0.tar.gz<br />
chown -R root:hadoop hadoop-2.2.0<br />
ln -s /hadoop-2.2.0 hadoop
</div>
<p>◇環境変数の設定</p>
<p>各アカウントに環境変数をそれぞれ追加するより、/etc/profileに追加すると便利です。</p>
<div class="div-example">
#java jdk home<br />
export JAVA_HOME=/usr/local/jdk</p>
<p>#hadoop environment<br />
export HADOOP_PREFIX=/hadoop<br />
export HADOOP_MAPRED_HOME=$HADOOP_PREFIX<br />
export HADOOP_COMMON_HOME=$HADOOP_PREFIX<br />
export HADOOP_HDFS_HOME=$HADOOP_PREFIX<br />
export HADOOP_YARN_HOME=$HADOOP_PREFIX</p>
<p>export YARN_HOME=$HADOOP_MAPRED_HOME<br />
export HADOOP_CONF_DIR=$HADOOP_PREFIX/etc/hadoop<br />
export YARN_CONF_DIR=$HADOOP_CONF_DIR</p>
<p>PATH=$JAVA_HOME/bin:$HADOOP_PREFIX/bin:$HADOOP_PREFIX/sbin:$PATH
</p></div>
<p>◇${HADOOP_PREFIX}/etc/hadoop/hadoop-env.shファイルに下記の変数を設定します</p>
<div class="div-example">
export JAVA_HOME=${JAVA_HOME}<br />
export HADOOP_LOG_DIR=${HADOOP_PREFIX}/logs/$USER<br />
export HADOOP_PID_DIR=${HADOOP_PREFIX}/tmp
</div>
<p>◇データ、コントロール情報を格納するディレクトリ領域を用意します</p>
<div class="div-example">
mkdir /hadoop-workspace22<br />
mkdir /hadoop-workspace22/storage<br />
mkdir /hadoop-workspace22/logs<br />
mkdir /hadoop-workspace22/tmp<br />
mkdir /hadoop-workspace22/run<br />
chown -R hadoop:hadoop /hadoop-workspace22<br />
chmod -R ug+w /hadoop-workspace22
</div>
<p>◇core-site.xmlファイルを下記のように設定します</p>
<div class="div-example">
<pre style="margin: 0; line-height: 125%"><span style="color: #007700">&lt;configuration&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>fs.defaultFS<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>hdfs://localhost:9000/<span style="color: #007700">&lt;/value&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>hadoop.tmp.dir<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>/hadoop-workspace22/tmp/${user.name}<span style="color: #007700">&lt;/value&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>      
      <span style="color: #007700">&lt;name&gt;</span>hadoop.native.lib<span style="color: #007700">&lt;/name&gt;</span>      
      <span style="color: #007700">&lt;value&gt;</span>true<span style="color: #007700">&lt;/value&gt;</span>      
      <span style="color: #007700">&lt;description&gt;</span>Should native hadoop libraries, if present, be used.<span style="color: #007700">&lt;/description&gt;</span>   
    <span style="color: #007700">&lt;/property&gt;</span> 
    <span style="color: #007700">&lt;property&gt;</span>
      <span style="color: #007700">&lt;name&gt;</span>hadoop.logfile.size<span style="color: #007700">&lt;/name&gt;</span>      
      <span style="color: #007700">&lt;value&gt;</span>10000000<span style="color: #007700">&lt;/value&gt;</span>      
      <span style="color: #007700">&lt;description&gt;</span>The max size of each log file<span style="color: #007700">&lt;/description&gt;</span>   
    <span style="color: #007700">&lt;/property&gt;</span>  
    <span style="color: #007700">&lt;property&gt;</span>      
      <span style="color: #007700">&lt;name&gt;</span>hadoop.logfile.count<span style="color: #007700">&lt;/name&gt;</span>      
      <span style="color: #007700">&lt;value&gt;</span>15<span style="color: #007700">&lt;/value&gt;</span>      
      <span style="color: #007700">&lt;description&gt;</span>The max number of log files<span style="color: #007700">&lt;/description&gt;</span>   
    <span style="color: #007700">&lt;/property&gt;</span>
<span style="color: #007700">&lt;/configuration&gt;</span>
</pre>
</div>
<p><a name="hdfs"></a></p>
<h3>HDFS</h3>
<p>◇hadoop-env.shに変数を追加、設定します。<br />
${HADOOP_PREFIX}/etc/hadoop/hadoop-env.shにデータ格納領域の境変数を追加します。</p>
<div class="div-example">
export HADOOP_WORKSPACE=/hadoop-workspace22<br />
export HADOOP_LOG_DIR=${HADOOP-WORKSPACE}/logs/$USER<br />
export HADOOP_PID_DIR=${HADOOP-WORKSPACE}/run
</div>
<p>◇hdfs-site.xmlファイルを下記のように設定します。</p>
<div class="div-example">
<pre style="margin: 0; line-height: 125%"><span style="color: #007700">&lt;configuration&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>dfs.namenode.name.dir<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>file:///hadoop-workspace22/storage/${user.name}/dfs/name<span style="color: #007700">&lt;/value&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>dfs.datanode.data.dir<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>file:///hadoop-workspace22/storage/${user.name}/dfs/data<span style="color: #007700">&lt;/value&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>dfs.namenode.checkpoint.dir<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>file:///hadoop-workspace22/storage/${user.name}/dfs/namesecondary<span style="color: #007700">&lt;/value&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>dfs.replication<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>1<span style="color: #007700">&lt;/value&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
<span style="color: #007700">&lt;/configuration&gt;</span>
</pre>
</div>
<p>◇HDFS領域をフォーマットします</p>
<div class="div-example">
sudo -u hdfs ${HADOOP_PREFIX}/bin/hdfs namenode -format
</div>
<p>◇HDFSデーモンを起動します。</p>
<div class="div-example">
 sudo -u hdfs ${HADOOP_PREFIX}/sbin/hadoop-daemon.sh start namenode<br />
 sudo -u hdfs ${HADOOP_PREFIX}/sbin/hadoop-daemon.sh start secondarynamenode<br />
 sudo -u hdfs ${HADOOP_PREFIX}/sbin/hadoop-daemon.sh start datanode
</div>
<p>◇HDFS上のディレクトリを作成し、アクセス権限を与えます</p>
<div class="div-example">
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -chown hdfs:hadoop /<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -chmod 755 /<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -mkdir /tmp<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -chown hdfs:hadoop /tmp<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -chmod 1777 /tmp<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -mkdir /user<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -chown hdfs:hadoop /user<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -chmod ug+w /user
</div>
<p>◇Web UIのアクセスURLは以下の通りです。</p>
<div class="div-example">
http://localhost:50070/  #NameNode<br />
http://localhost:50090/  #Secondary NameNode
</div>
<p><a name="yarn"></a></p>
<h3>YARN</h3>
<p>◇yarn-env.shに下記の環境変数を追加する</p>
<div class="div-example">
export HADOOP_WORKSPACE=/hadoop-workspace22<br />
export YARN_LOG_DIR=${HADOOP_WORKSPACE}/logs<br />
export YARN_PID_DIR=${HADOOP_WORKSPACE}/run
</div>
<p>◇yarn-site.xmlファイルに下記の設定を追加する</p>
<div class="div-example">
<!-- HTML generated using hilite.me -->
<div style="background: #ffffff; overflow:auto;width:auto;border:solid gray;border-width:.1em .1em .1em .8em;padding:.2em .6em;">
<pre style="margin: 0; line-height: 125%"><span style="color: #007700">&lt;configuration&gt;</span>

<span style="color: #888888">&lt;!-- Site specific YARN configuration properties --&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>yarn.resourcemanager.scheduler.class<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler<span style="color: #007700">&lt;/value&gt;</span>
        <span style="color: #007700">&lt;description&gt;</span>In case you do not want to use the default scheduler<span style="color: #007700">&lt;/description&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>yarn.nodemanager.local-dirs<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>/hadoop-workspace22/${user.name}/nm/local<span style="color: #007700">&lt;/value&gt;</span>
        <span style="color: #007700">&lt;description&gt;</span>
              the local directories used by the nodemanager
              (default: /tmp/nm-local-dir)
        <span style="color: #007700">&lt;/description&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
<span style="color: #888888">&lt;!--</span>
<span style="color: #888888">    &lt;property&gt;</span>
<span style="color: #888888">        &lt;name&gt;yarn.nodemanager.address&lt;/name&gt;</span>
<span style="color: #888888">        &lt;value&gt;0.0.0.0:0&lt;/value&gt;</span>
<span style="color: #888888">        &lt;description&gt;the nodemanagers bind to this port&lt;/description&gt;</span>
<span style="color: #888888">    &lt;/property&gt; </span>
<span style="color: #888888">--&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>yarn.nodemanager.resource.memory-mb<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>8192<span style="color: #007700">&lt;/value&gt;</span>
        <span style="color: #007700">&lt;description&gt;</span>
            the amount of memory on the NodeManager in GB (default: 8192)
        <span style="color: #007700">&lt;/description&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>yarn.nodemanager.remote-app-log-dir<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>/hadoop-workspace22/logs/${user.name}/nm<span style="color: #007700">&lt;/value&gt;</span>
        <span style="color: #007700">&lt;description&gt;</span>
            directory on hdfs where the application logs are moved to (default: /tmp/logs)
        <span style="color: #007700">&lt;/description&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>yarn.nodemanager.log-dirs<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>/hadoop-workspace22/logs/${user.name}/nm<span style="color: #007700">&lt;/value&gt;</span>
        <span style="color: #007700">&lt;description&gt;</span>
             the directories used by Nodemanagers as log directories (default: /tmp/logs)
        <span style="color: #007700">&lt;/description&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>yarn.nodemanager.aux-services<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>mapreduce_shuffle<span style="color: #007700">&lt;/value&gt;</span>
        <span style="color: #007700">&lt;description&gt;</span>shuffle service that needs to be set for Map Reduce to run<span style="color: #007700">&lt;/description&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>mapreduce.job.hdfs-servers<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>${fs.defaultFS}<span style="color: #007700">&lt;/value&gt;</span>
        <span style="color: #888888">&lt;!-- yarn-default.xml deprecated key: fs.default.name  --&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
<span style="color: #007700">&lt;/configuration&gt;</span>
</pre>
</div>
</div>
<p>◇ローカルファイルシステムのディレクトリを作成して権限を付与します</p>
<div class="div-example">
sudo mkdir /hadoop-workspace22/logs/yarn<br />
sudo mkdir -p /hadoop-workspace22/logs/yarn/nm<br />
sudo mkdir -p  /hadoop-workspace22/logs/yarn/nm/local<br />
sudo chown -R yarn:hadoop /hadoop-workspace22/logs/yarn<br />
sudo chmod ug+w /hadoop-workspace22/logs/yarn
</div>
<p>◇HDFS上に必要なディレクトリを作成します</p>
<div class="div-example">
#yarn.nodemanager.remote-app-log-dir<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -mkdir /hadoop-workspace22/logs<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -mkdir /hadoop-workspace22/logs/yarn<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -mkdir /hadoop-workspace22/logs/yarn/nm<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -chown yarn:hadoop /hadoop-workspace22/logs/yarn/nm<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -chmod 1777 /hadoop-workspace22/logs/yarn/nm
</div>
<p>◇yarnサービスを起動します。</p>
<div class="div-example">
sudo -u yarn ${HADOOP_PREFIX}/sbin/yarn-daemon.sh start resourcemanager<br />
sudo -u yarn ${HADOOP_PREFIX}/sbin/yarn-daemon.sh start nodemanager
</div>
<p>◇Web UIのアクセスURLは以下の通りです</p>
<div class="div-example">
http://localhost:8088/    # ResourceManager<br />
http://localhost:8042/    # NodeManager
</div>
<p><a name="mapreduce"></a></p>
<h3>MapReduce</h3>
<p>◇mapred-env.shに下記の環境変数を設定する</p>
<div class="div-example">
export HADOOP_WORKSPACE=/hadoop-workspace22<br />
export HADOOP_MAPRED_PID_DIR=$HADOOP_WORKSPACE/run<br />
export HADOOP_MAPRED_LOG_DIR=$HADOOP_WORKSPACE/logs/$USER
</div>
<p>◇mapred-site.xmlを設定する</p>
<div class="div-example">
<pre style="margin: 0; line-height: 125%"><span style="color: #007700">&lt;configuration&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>mapreduce.framework.name<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>yarn<span style="color: #007700">&lt;/value&gt;</span>
        <span style="color: #007700">&lt;description&gt;</span>The runtime framework for executing MapReduce jobs.
        Can be one of local, classic or yarn.
        (default: local)
        <span style="color: #007700">&lt;/description&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>mapreduce.cluster.local.dir<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>/hadoop-workspace22/mapred/local<span style="color: #007700">&lt;/value&gt;</span>
        <span style="color: #007700">&lt;description&gt;</span>The local directory where MapReduce stores intermediate
        data files.  May be a comma-separated list of
        directories on different devices in order to spread disk i/o.
        Directories that do not exist are ignored.
        (default: ${hadoop.tmp.dir}/mapred/local on LOCAL)
        <span style="color: #007700">&lt;/description&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>mapreduce.jobtracker.system.dir<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>/hadoop-workspace22/mapred/system<span style="color: #007700">&lt;/value&gt;</span>
        <span style="color: #007700">&lt;description&gt;</span>The directory where MapReduce stores control files.
        (default: ${hadoop.tmp.dir}/mapred/system on HDFS)
        <span style="color: #007700">&lt;/description&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>

    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>yarn.app.mapreduce.am.staging-dir<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>/user<span style="color: #007700">&lt;/value&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
<span style="color: #888888">&lt;!--    </span>
<span style="color: #888888">    &lt;property&gt;</span>
<span style="color: #888888">        &lt;name&gt;mapreduce.jobtracker.staging.root.dir&lt;/name&gt;</span>
<span style="color: #888888">        &lt;value&gt;/user&lt;/value&gt;</span>
<span style="color: #888888">        &lt;description&gt;The root of the staging area for users&#39; job files</span>
<span style="color: #888888">        In practice, this should be the directory where users&#39; home</span>
<span style="color: #888888">        directories are located (usually /user)</span>
<span style="color: #888888">        (default: ${hadoop.tmp.dir}/mapred/staging on HDFS)</span>
<span style="color: #888888">        &lt;/description&gt;</span>
<span style="color: #888888">    &lt;/property&gt;</span>
<span style="color: #888888">    --&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>mapreduce.cluster.temp.dir<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>/hadoop-workspace22/mapred/temp<span style="color: #007700">&lt;/value&gt;</span>
        <span style="color: #007700">&lt;description&gt;</span>A shared directory for temporary files.
        (default: ${hadoop.tmp.dir}/mapred/temp on LOCAL)
        <span style="color: #007700">&lt;/description&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span>
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>mapreduce.jobhistory.intermediate-done-dir<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>/hadoop-workspace22/mapred/history/intermediate_done<span style="color: #007700">&lt;/value&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span> 
    <span style="color: #007700">&lt;property&gt;</span>
        <span style="color: #007700">&lt;name&gt;</span>mapreduce.jobhistory.done-dir<span style="color: #007700">&lt;/name&gt;</span>
        <span style="color: #007700">&lt;value&gt;</span>/hadoop-workspace22/mapred/history/done<span style="color: #007700">&lt;/value&gt;</span>
    <span style="color: #007700">&lt;/property&gt;</span> 
 
<span style="color: #007700">&lt;/configuration&gt;</span>
</pre>
</div>
<p>◇HDFS上に必要なディレクトリを追加します</p>
<div class="div-example">
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -mkdir /hadoop-workspace22/mapred/history<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -chown -R mapred:hadoop /hadoop-workspace22/mapred<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -chmod -R ug+wr /hadoop-workspace22/mapred
</div>
<p>◇履歴サーバーを起動します</p>
<p>起動失敗した場合、/hadoop-workspace22/logs/mapredにあるログファイルを確認してHDFS上のディレクトリに書き込み権限があるかどうか再確認してください</p>
<div class="div-example">
sudo -u mapred ${HADOOP_PREFIX}/sbin/mr-jobhistory-daemon.sh start historyserver
</div>
<p>◇履歴サーバWeb UIのアクセスURLは以下の通りです</p>
<div class="div-example">
<p>http://localhost:19888/</p>
</div>
<p><a name="test"></a></p>
<h3>テスト、確認</h3>
<p>◇テストユーザ作成</p>
<div class="div-example">
sudo adduser htest<br />
sudo usermod -a -G hadoop htest
</div>
<p>◇HDFS上のユーザジョブ格納ディレクトリ作成</p>
<div class="div-example">
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -mkdir /user/htest<br />
sudo -u hdfs ${HADOOP_PREFIX}/bin/hadoop fs -chown htest:htest /user/aidabo
</div>
<p>◇ジョブ実行前のプロセス</p>
<div class="div-example">
jps|sort<br />
17440 NameNode<br />
17516 SecondaryNameNode<br />
17572 DataNode<br />
18950 ResourceManager<br />
19183 NodeManager<br />
29116 JobHistoryServer
</div>
<p>◇MapReduceテスト</p>
<div class="div-example">
sudo -u htest ${HADOOP_PREFIX}/bin/hadoop jar /hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar pi 5 10<br />
sudo -u htest ${HADOOP_PREFIX}/bin/hadoop jar /hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar  randomwriter out
</div>
<p>◇ジョブ起動中のプロセス</p>
<div class="div-example">
 jps|sort<br />
17440 NameNode<br />
17516 SecondaryNameNode<br />
17572 DataNode<br />
18950 ResourceManager<br />
19183 NodeManager<br />
29116 JobHistoryServer<br />
34499 RunJar<br />
34705 MRAppMaster<br />
35062 YarnChild<br />
35072 YarnChild<br />
35074 YarnChild<br />
35079 YarnChild<br />
35080 YarnChild
</div>
<p>◇ジョブ終了後のプロセス</p>
<div class="div-example">
jps|sort<br />
17440 NameNode<br />
17516 SecondaryNameNode<br />
17572 DataNode<br />
18950 ResourceManager<br />
19183 NodeManager<br />
29116 JobHistoryServer
</div>
<p>◇ジョブ実行終了後、historyserverから確認します。</p>
<div class="div-example">
<p>http://localhost:19888/jobhistory</p>
</div>
<p>The post <a href="http://www.janabiz.com/hadoop-single-node-setup/">Hadoop-2.2.10 Single nodeのセットアップ</a> appeared first on <a href="http://www.janabiz.com">ジャナ・ビジネス・コンサルティング</a>.</p>]]></content:encoded>
			<wfw:commentRss>http://www.janabiz.com/hadoop-single-node-setup/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

<!-- Performance optimized by W3 Total Cache. Learn more: http://www.w3-edge.com/wordpress-plugins/

 Served from: www.janabiz.com @ 2026-05-02 04:01:12 by W3 Total Cache -->