Space-X

hadoopRPC

2019-05-10T12:56:12.000Z

Hadoop RPC模块源码分析

RPC概述

参考文章

https://www.cnblogs.com/qq503665965/p/6708644.html

RPC组成

Hadoop RPC主要由三大类组成，即RPC、Client、和Server ，分别对应对外编程接口、客户端实现和服务器端实现。Hadoop 关于rpc的代码在hadoop-common下的org.apache.hadoop.ipc包中。

类结构关系详解

类图是老版本的，部分函数名有变化但是架构没变。

ipc.RPC
关键类图如下：
ipc.Client
关键类图分析如下：

ipc.Server

源码分析

client 实现

Client端实现结构如下图所示，从图中可以看出Client 包含两个内部类 Call和Connection

static class Call 内部类

该类封装了一个RPC请求，它包含五个成员变量，分别是唯一标识id，函数调用信息rpcRequest、函数执行返回值rpcResponse，异常信息error和执行完成标识done。由于HadoopRPCServer采用了异步方式处理客户端请求，这使得远程过程调用的发生顺序与结果返回顺序无直接关系，而Client端正是通过id识别不同的函数调用。当客户端向服务端发送请求时，只需要填充id和rpcRequest这两个变量，而剩下的三个变量：rpcResponse,error,done,则由服务端根据函数执行情况填充.

static class Call {
  final int id;               // call id
  final int retry;           // retry count
  final Writable rpcRequest;  // the serialized rpc request
  Writable rpcResponse;       // null if rpc has error
  IOException error;          // exception, null if success
  final RPC.RpcKind rpcKind;      // Rpc EngineKind
  boolean done;               // true when call is done
  ...
  public synchronized void setRpcResponse(Writable rpcResponse) {
    this.rpcResponse = rpcResponse;
    callComplete();
  }
  ...
  protected synchronized void callComplete() {
    this.done = true;
    notify();                                 // notify caller
  }  
}

通过Call的setRpcResponse来设置RPC请求返回的结果，设置后并调用Call的callComplete方法

private class Connection extends Thread内部类

用Client与每个Server之间维护一个通信连接。该连接相关的基本信息及操作被封装到Connection类中，其中基本信息主要包括：通信连接唯一标识remoteId,与Server端通信的Socket,网络输入流in,网络输出流out,保存RPC请求的哈希表calls等.

private class Connection extends Thread {
    private InetSocketAddress server;             // server ip:port
    private final ConnectionId remoteId;                // connection id
    private Socket socket = null;                 // connected socket
    private DataInputStream in;
    private DataOutputStream out;
    ...
    private Hashtable calls = new Hashtable();
    ...
    private synchronized void setupIOstreams(
        AtomicBoolean fallbackToSimpleAuth) 
    {
      if (socket != null || shouldCloseConnection.get()) {
        return;
      } 
      try {
        if (LOG.isDebugEnabled()) {
          LOG.debug("Connecting to "+server);
        }
        if (Trace.isTracing()) {
          Trace.addTimelineAnnotation("IPC client connecting to " + server);
        }
        short numRetries = 0;
        Random rand = null;
        while (true) {
          // 与远程服务器建立连接, 创建一个Socket对象  
          setupConnection();
          InputStream inStream = NetUtils.getInputStream(socket);// 获取输入流 
          OutputStream outStream = NetUtils.getOutputStream(socket); // 获取输出流
          // 发送RPC Header信息给RPC服务器, 这里RPC服务器正常接收后不会响应, 因为只会验证客户端和服务端RPC程序版本是否匹配, 但是验证没通过后会响应失败状态, 并且服务端会关闭连接 
          writeConnectionHeader(outStream);
          ...
          // 包装输入输出流给in 和 out
          this.in = new DataInputStream(new BufferedInputStream(inStream));
          if (!(outStream instanceof BufferedOutputStream)) {
            outStream = new BufferedOutputStream(outStream);
          }
          this.out = new DataOutputStream(outStream);
          // 调用start()启动线程
          start();
          return;
        }
      }
    }
    ...
    
}

在Connection的setupIOstreams方法中会去建立和服务端的连接，本质会去创建一个Socket对象，建立一个TCP长连接，并且封装相关输入输出流。最后调用start（）启动线程

public void sendRpcRequest(final Call call)
        throws InterruptedException, IOException {
      if (shouldCloseConnection.get()) {
        return;
      }
    ...
     synchronized (sendRpcRequestLock) {
        Future senderFuture = sendParamsExecutor.submit(new Runnable() {
          @Override
          public void run() {
            try {
              synchronized (Connection.this.out) {
                  //// 对于同一个OutputStream必须同步发送RPC调用, 因为在同一个连接上的多个调用Call必须在同步下进行RPC请求  
                if (shouldCloseConnection.get()) {
                  return;
                }
                
                if (LOG.isDebugEnabled())
                  LOG.debug(getName() + " sending #" + call.id);
         
                byte[] data = d.getData();
                int totalLength = d.getLength();
                out.writeInt(totalLength); // Total Length 1.写入CallId和调用参数（方法名、方法参数类型、方法参数值）的长度, 4个字节  
                out.write(data, 0, totalLength);// RpcRequestHeader + RpcRequest2.写入CallId和序列化后的调用参数（方法名、方法参数类型、方法参数值）  
                out.flush();
              }
            } catch (IOException e) {...}
            try {
              senderFuture.get();
            } catch (ExecutionException e) {
              Throwable cause = e.getCause();}
           ...
          }
        } ...

客户端发起RPC请求时，会先去把请求相关的调用方法参数等序列化成字节流发送给服务端，核心代码如上

public void run() {
      if (LOG.isDebugEnabled())
        LOG.debug(getName() + ": starting, having connections " 
            + connections.size());

      try {
        while (waitForWork()) {//wait here for work - read or close connection
          receiveRpcResponse();
        }
      } catch (Throwable t) {
        // This truly is unexpected, since we catch IOException in receiveResponse
        // -- this is only to be really sure that we don't leave a client hanging
        // forever.
        LOG.warn("Unexpected error reading responses on connection " + this, t);
        markClosed(new IOException("Error reading responses", t));
      }
      
      close();
      
      if (LOG.isDebugEnabled())
        LOG.debug(getName() + ": stopped, remaining connections "
            + connections.size());
    }

connection类的run函数不停地调用receiveRpcResponse（）方法来获取服务端结果

receiveResponse 函数的关键代码如下，在receiveResponse中主要获取应答头部，根据服务端返回的头部信息判断Rpc请求应答的status,并读取callId通过callId映射到Call对象，并从该Connection持有的所有的calls映射中删除该call，读取输入流，调用Call对象的setRpcResponse()为该call设置RpcResponse

private void receiveRpcResponse() {
    try {
        int totalLen = in.readInt();
           RpcResponseHeaderProto header = 
               RpcResponseHeaderProto.parseDelimitedFrom(in);
           checkResponse(header);
        int callId = header.getCallId();
        Call call = calls.get(callId);
        RpcStatusProto status = header.getStatus();
        int callId = header.getCallId();
        Call call = calls.get(callId);
        if (status == RpcStatusProto.SUCCESS) {
             Writable value = ReflectionUtils.newInstance(valueClass, conf);
             value.readFields(in);                 // read value
             calls.remove(callId);
             call.setRpcResponse(value);
            ...
        }
    }catch(){}
}

Client 主类

call()方法：通过ConnectionId获取/建立连接，并封装rpc请求call，通过connection发送rpc请求，发送后同步call代码段中不停地检测call是否done，如果非done则wait()阻塞直到相应的connection调用receiveRpcResponse（）方法触发call.setRpcResponse(value)进而触发callComplete（）方法。

public Writable call(RPC.RpcKind rpcKind, Writable rpcRequest,
     ConnectionId remoteId, int serviceClass,
     AtomicBoolean fallbackToSimpleAuth) throws IOException {
   final Call call = createCall(rpcKind, rpcRequest);
   Connection connection = getConnection(remoteId, call, serviceClass,
     fallbackToSimpleAuth);
   try {
     connection.sendRpcRequest(call);                 // send the rpc request
   } catch (RejectedExecutionException e) {
     throw new IOException("connection has been closed", e);
   } catch (InterruptedException e) {
     Thread.currentThread().interrupt();
     LOG.warn("interrupted waiting to send rpc request to server", e);
     throw new IOException(e);
   }
   
   synchronized (call) {
     while (!call.done) {
       try {
         call.wait();                           // wait for the result
       } catch (InterruptedException ie) {
         Thread.currentThread().interrupt();
         throw new InterruptedIOException("Call interrupted");
       }
     }
   
     if (call.error != null) {
       if (call.error instanceof RemoteException) {
         call.error.fillInStackTrace();
         throw call.error;
       } else { // local exception
         InetSocketAddress address = connection.getRemoteAddress();
         throw NetUtils.wrapException(address.getHostName(),
                 address.getPort(),
                 NetUtils.getHostname(),
                 0,
                 call.error);
       }
     } else {
       return call.getRpcResponse();
     }
   }
 }

getConnection()方法：

首先通过ConnectionID查找client的connections中是否包含改connection, 不包含则创建新的并加入到connections中。调用Connection的setupIOstreams方法包装输入、输出流并调用start().s

private Connection getConnection(ConnectionId remoteId,
     Call call, int serviceClass, AtomicBoolean fallbackToSimpleAuth)
     throws IOException {
   if (!running.get()) {
     // the client is stopped
     throw new IOException("The client is stopped");
   }
   Connection connection;
   /* we could avoid this allocation for each RPC by having a  
    * connectionsId object and with set() method. We need to manage the
    * refs for keys in HashMap properly. For now its ok.
    */
   do {
     synchronized (connections) {
       connection = connections.get(remoteId);
       if (connection == null) {
         connection = new Connection(remoteId, serviceClass);
         connections.put(remoteId, connection);
       }
     }
   } while (!connection.addCall(call));
   
   //we don't invoke the method below inside "synchronized (connections)"
   //block above. The reason for that is if the server happens to be slow,
   //it will take longer to establish a connection and that will slow the
   //entire system down.
   connection.setupIOstreams(fallbackToSimpleAuth);
   return connection;
 }

综上所述，Client端处理流程具体序列如下图所示：

Server 实现

Server的结构如下图所示，从图中可以看出，server端包含的内部类比较多，其中一些是和Client端重复的Call，还有一些是Server独有的如Reader（Listener的内部类）、Handler、Listener、Responder 他们的作用如下：

Listener ：请求监听类，用于监听客户端发来的请求.
Connection ：连接类，真正的客户端请求读取逻辑在这个类中.
Reader : （Listener的内部类）当监听器监听到用户请求，便让Reader读取用户请求数据.
Call ：用于封装客户端发来的请求.
Handler ：请求处理类，会循环阻塞读取callQueue中的call对象，并对其进行操作.
Responder ：响应RPC请求类，请求处理完毕，由Responder发送给请求客户端.

请求处理阶段

该阶段的主要任务是接收来自各个客户端的RPC请求，并将它们封装成固定的格式（Call对象）放到一个共享阻塞队列callQueue中，以便进行后续处理。该阶段内部又分为两个子阶段：请求接收和请求读取，分别有两种线程完成：Listener和Reader请求接收线程Listener初始化源码如下，整个Server只有一个Listener线程，统一负责监听来自客户端的连接请求，一旦有新的请求到达，它会采用轮训的方式从线程池中选择一个Reader线程进行处理。Listener的run() 方法中会阻塞等待客户端请求建立连接，Listener的run()方法的核心代码.

private class Listener extends Thread {
   
   private ServerSocketChannel acceptChannel = null; //the accept channel
   private Selector selector = null; //the selector that we use for the server
   private Reader[] readers = null;
   private int currentReader = 0;
   private InetSocketAddress address; //the address we bind at
   ...
}

Listerner 的run方法: 在Selector中

public void run() {
     LOG.info(Thread.currentThread().getName() + ": starting");
     SERVER.set(Server.this);
     connectionManager.startIdleScan();
     while (running) {
       SelectionKey key = null;
       try {
         getSelector().select();// 如果Selector中注册的ServerSocketChannel没有新的Socket请求的话, 就阻塞在这里  
         Iterator iter = getSelector().selectedKeys().iterator();
         while (iter.hasNext()) {
           key = iter.next();
           iter.remove();
           try {
             if (key.isValid()) {
               if (key.isAcceptable())
                 doAccept(key);// 处理连接事件  
             }
           } catch (IOException e) {
           }
           key = null;
         }
       } catch (OutOfMemoryError e) {
         // we can run out of memory if we have too many threads
         // log the event and sleep for a minute and give 
         // some thread(s) a chance to finish
         LOG.warn("Out of Memory in server select", e);
         closeCurrentConnection(key, e);
         connectionManager.closeIdle(true);
         try { Thread.sleep(60000); } catch (Exception ie) {}
       } catch (Exception e) {
         closeCurrentConnection(key, e);
       }
     }
    ...
}

紧接着具体的请求接收处理是在Listener的doAccept()方法中处理的，获取连接后会往Reader线程中的多路复用器Selector注册连接，Listener的doAccept方法的核心代码如下：

void doAccept(SelectionKey key) throws InterruptedException, IOException,  OutOfMemoryError {
      ServerSocketChannel server = (ServerSocketChannel) key.channel();// 拿到ServerSocketchannel  
      SocketChannel channel;// 拿到Socketchannel  
      while ((channel = server.accept()) != null) { // 非阻塞的拿到SocketChannel  

        channel.configureBlocking(false);// 把SocketChannel设置为非阻塞模式  
        channel.socket().setTcpNoDelay(tcpNoDelay);
        channel.socket().setKeepAlive(true);
        
        Reader reader = getReader();// 随机轮询获取一个Rearder线程  
        Connection c = connectionManager.register(channel);
        // If the connectionManager can't take it, close the connection.
        if (c == null) {
          if (channel.isOpen()) {
            IOUtils.cleanup(null, channel);
          }
          connectionManager.droppedConnections.getAndIncrement();
          continue;
        }
        key.attach(c);  // so closeCurrentConnection can get the object
        reader.addConnection(c);
      }
    }

客户端和服务端连接建立成功之后，服务端的Reader线程中维护了连接，有了连接就可以传输数据，Reader线程的run方法中就是阻塞去等待客户端的请求数据，一旦该连接上有可读数据，该Reader线程就会被唤醒，紧接着会去解析字节流序列化请求数据，封装成Call对象，塞到callQueue阻塞队列，Reader的run()方法的核心代码如下：

public void run() {
       LOG.info("Starting " + Thread.currentThread().getName());
       try {
         doRunLoop();
       } finally {
         try {
           readSelector.close();
         } catch (IOException ioe) {
           LOG.error("Error closing read selector in " + Thread.currentThread().getName(), ioe);
         }
       }
     }
private synchronized void doRunLoop() {
       while (running) {
         SelectionKey key = null;
         try {
           // consume as many connections as currently queued to avoid
           // unbridled acceptance of connections that starves the select
           int size = pendingConnections.size();
           for (int i=size; i>0; i--) {
             Connection conn = pendingConnections.take();
             conn.channel.register(readSelector, SelectionKey.OP_READ, conn);
           }
           readSelector.select();// 如果Selector中注册的SocketChannel中都没有可读数据的话, 就阻塞在这里  
   
           Iterator iter = readSelector.selectedKeys().iterator();
           while (iter.hasNext()) {
             key = iter.next();
             iter.remove();
             try {
               if (key.isReadable()) { // SocketChannel有可读数据  
                 doRead(key);
               }
                 ...
             }
           }
         }
       }
}

在Reader的run 中调用了doRunLoop()方法，该方法将connections注册到readSelector，并调用doRead()读取SockletChannel中的数据（如果有）。doRead（）中具体的读取及解析请求数据交给Connection来处理，核心代码如下：

 void doRead(SelectionKey key) throws InterruptedException {
      int count = 0;
      Connection c = (Connection)key.attachment();
      if (c == null) {
        return;  
      }
      c.setLastContact(Time.now());
      
      try {
        count = c.readAndProcess();
      } catch (InterruptedException ieo) {
        LOG.info(Thread.currentThread().getName() + ": readAndProcess caught InterruptedException", ieo);
        throw ieo;
      } catch (Exception e) {...
                            }
 }
}

在doRead中调用了Connection的readAndProcess（）方法，接着来看Connection类的readAndProcess()方法，主要从连接中读取请求数据，核心代码如下：

public int readAndProcess()
       throws WrappedRpcServerException, IOException, InterruptedException {
     while (true) {
         ...;
        if (data == null) {
         dataLengthBuffer.flip();
         dataLength = dataLengthBuffer.getInt();
         checkDataLength(dataLength);
         data = ByteBuffer.allocate(dataLength);// 根据dataLength创建一个dataLength大小的缓冲区, 用来读数据  
       }
       
       count = channelRead(channel, data);// 读取第一次请求Header信息或请求数据  
       
       if (data.remaining() == 0) {
         dataLengthBuffer.clear();// 清空dataLengthBuffer  
         data.flip();
         boolean isHeaderRead = connectionContextRead;
         processOneRpc(data.array());// 处理rpc请求,把封装好的请求信息Call塞到callQueue阻塞队列  
         data = null;
         if (!isHeaderRead) { // 读取第一次RPC请求Header之后会再continue, 继续读取请求数据
           continue;
         }
       } 
       return count;
     }

在readAndProcess中调用processOneRpc()方法处理rpc请求，在processOneRpc（）中调用processRpcRequest（）方法来将请求解析封装成server端的Call对象并加入callQueue中。

private void processOneRpc(byte[] buf)
    throws IOException, WrappedRpcServerException, InterruptedException {
    int callId = -1;
    // 通过输入流读取buf
    final DataInputStream dis =
            new DataInputStream(new ByteArrayInputStream(buf));
    // 通过流操作，获取header
    final RpcRequestHeaderProto header =
            decodeProtobufFromStream(RpcRequestHeaderProto.newBuilder(), dis);
    callId = header.getCallId();
    callId = header.getCallId();
    retry = header.getRetryCount();
    .......;
    if (callId < 0) { // callIds typically used during connection setup
          processRpcOutOfBandRequest(header, dis);
        } else if (!connectionContextRead) {
          throw new WrappedRpcServerException(
              RpcErrorCodeProto.FATAL_INVALID_RPC_HEADER,
              "Connection context not established");
        } else {
        // callId正常 调用processRpcRequest
          processRpcRequest(header, dis);
        }
      } catch (WrappedRpcServerException wrse) { // inform client of error
        Throwable ioe = wrse.getCause();
    //构造error call，并调用setupResponse函数通知给客户端错误。
        final Call call = new Call(callId, retry, null, this);
        setupResponse(authFailedResponse, call,
            RpcStatusProto.FATAL, wrse.getRpcErrorCodeProto(), null,
            ioe.getClass().getName(), ioe.getMessage());
        call.sendResponse();
        throw wrse;
      }

private void processRpcRequest(RpcRequestHeaderProto header,
       DataInputStream dis) throws WrappedRpcServerException,
       InterruptedException {
     Writable rpcRequest;
     try { //Read the rpc request
       rpcRequest = ReflectionUtils.newInstance(rpcRequestClass, conf);
       rpcRequest.readFields(dis);
     }catch(){}
          ......;
  // 构造新call
     Call call = new Call(header.getCallId(), header.getRetryCount(),
         rpcRequest, this, ProtoUtil.convert(header.getRpcKind()),
         header.getClientId().toByteArray(), traceSpan);
     //将call 加入到队列中
      if (callQueue.isClientBackoffEnabled()) {
       // if RPC queue is full, we will ask the RPC client to back off by
       // throwing RetriableException. Whether RPC client will honor
       // RetriableException and retry depends on client ipc retry policy.
       // For example, FailoverOnNetworkExceptionRetry handles
       // RetriableException.
       queueRequestOrAskClientToBackOff(call);
     } else {
       callQueue.put(call);              // queue the call; maybe blocked here
     }
     incRpcCount();  // Increment the rpc count
     
           
       }

至此请求接收结束。

请求处理

该阶段的主要任务是从共享队列callQueue中获取Call对象，执行相应的函数调用，并将结果返回给客户端，这全部由Handler线程完成的。Server端可同时存在多个Handler线程。它们并行从共享队列中读取Call对象,经执行对应的韩式调用后，将尝试着直接将结果返回给对应的客户端。但考虑到某些函数调用返回的结果很大或者网络速度过慢，可能难以将结果一次性发送到客户端，此时Handler将尝试着将后续发送任务交给Responder线程。Handler的run方法中会阻塞等待callQueue队列中有请求数据，Handler的run()核心代码如下：

public void run() { 
    LOG.debug(Thread.currentThread().getName() + ": starting");
      SERVER.set(Server.this);
      ByteArrayOutputStream buf = 
        new ByteArrayOutputStream(INITIAL_RESP_BUF_SIZE);
    while (running) {
            TraceScope traceScope = null;
            try {
              final Call call = callQueue.take(); // pop the queue; maybe blocked here
              String errorClass = null;
              String error = null;
              RpcStatusProto returnStatus = RpcStatusProto.SUCCESS;
              RpcErrorCodeProto detailedErr = null;
              Writable value = null;

              CurCall.set(call);
              ...;

              try {
                // Make the call as the user via Subject.doAs, thus associating
                // the call with the Subject
                if (call.connection.user == null) {
                  value = call(call.rpcKind, call.connection.protocolName, call.rpcRequest, call.timestamp);
                } else {
                  value = 
                    call.connection.user.doAs
                      (new PrivilegedExceptionAction() {
                         @Override
                         public Writable run() throws Exception {
                           // make the call
                          // 反射调用对应服务，返回结果ObjectWritable, 传入Connection中接口的Class对象, 是在建立连接之后第一次客户端请求带过来的  
                           return call(call.rpcKind, call.connection.protocolName, 
                                       call.rpcRequest, call.timestamp);

                         }
                       }
                      );
                }catch(Expection e){...}
                ...;
                 CurCall.set(null);
              synchronized (call.connection.responseQueue) {
                  // 同一个连接上的多个响应必须在同步下进行  
                setupResponse(buf, call, returnStatus, detailedErr,
                    value, errorClass, error);// 生成返回给客户端的数据包,包含(客户端调用ID+状态status+RPC方法返回值),设置到Call对象中  

                // Discard the large buf and reset it back to smaller size
                // to free up heap.
                if (buf.size() > maxRespSize) {
                  LOG.warn("Large response size " + buf.size() + " for call "
                      + call.toString());
                  buf = new ByteArrayOutputStream(INITIAL_RESP_BUF_SIZE);
                }
                call.sendResponse();
              }catch(Exception e){...}

            }
     }
    }

服务端拿到调用参数之后，会反射调用对应服务，返回方法返回值

请求响应

每个Handler线程执行完函数调用后，会尝试着将执行结果返回给客户端，但由于特殊情况，比如函数调用返回的结果过大或者网络异常情况，会将发送任务交给Responder线程，Server端仅存在一个Responder线程，它的内部包含一个多路复用器Selector对象，用于监听SelectionKey.OP_WRITE事件，当Handler没能够将结果一次性发送到客户端时，会向该Selector对象注册SelectorKey.OP_WRITE事件，进而由Responder线程采用异步方式继续发送未发送完成的结果，具体的核心代码如下：

public void run() {
      LOG.info(Thread.currentThread().getName() + ": starting");
      SERVER.set(Server.this);
      try {
        doRunLoop();
      } finally {
        LOG.info("Stopping " + Thread.currentThread().getName());
        try {
          writeSelector.close();
        } catch (IOException ioe) {
          LOG.error("Couldn't close write selector in " + Thread.currentThread().getName(), ioe);
        }
      }
    }

看看 doRunLoop函数干什么,从多路复用器Selector对象获取Handler 未发送的结果，调用doAsyncWrite异步写发送。

private void doRunLoop() {
  long lastPurgeTime = 0;   // last check for old calls.

  while (running) {
    try {
      waitPending();     // If a channel is being registered, wait.
      writeSelector.select(PURGE_INTERVAL);
      Iterator iter = writeSelector.selectedKeys().iterator();
      while (iter.hasNext()) {
        SelectionKey key = iter.next();
        iter.remove();
        try {
          if (key.isWritable()) {
            doAsyncWrite(key);
          }
        } catch (CancelledKeyException cke) {...}
        ...;

      }
    }
  }
}

那再看看doAsyncWrite（）内部

private void doAsyncWrite(SelectionKey key) throws IOException {
  Call call = (Call)key.attachment();
  if (call == null) {
    return;
  }
  if (key.channel() != call.connection.channel) {
    throw new IOException("doAsyncWrite: bad channel");
  }

  synchronized(call.connection.responseQueue) {//  同一个连接上的多个响应必须在同步下进行
    if (processResponse(call.connection.responseQueue, false)) {
      try {
        key.interestOps(0);
      } catch (CancelledKeyException e) {
        /* The Listener/reader might have closed the socket.
         * We don't explicitly cancel the key, so not sure if this will
         * ever fire.
         * This warning could be removed.
         */
        LOG.warn("Exception while changing ops : " + e);
      }
    }
  }
}

Server 端的状态转移图如下所示：

Memory Paging

2019-04-04T05:03:25.000Z

一、分页内存管理

1.1 解决问题之道

　　为了解决交换系统存在的缺陷，分页系统横空出世。分页系统的核心在于：将虚拟内存空间和物理内存空间皆划分为大小相同的页面，如4KB、8KB或16KB等，并以页面作为内存空间的最小分配单位，一个程序的一个页面可以存放在任意一个物理页面里。

　　（1）解决空间浪费碎片化问题

　　由于将虚拟内存空间和物理内存空间按照某种规定的大小进行分配，这里我们称之为页（Page），然后按照页进行内存分配，也就克服了外部碎片的问题。

　　（2）解决程序大小受限问题

　　程序增长有限是因为一个程序需要全部加载到内存才能运行，因此解决的办法就是使得一个程序无须全部加载就可以运行。使用分页也可以解决这个问题，只需将当前需要的页面放在内存里，其他暂时不用的页面放在磁盘上，这样一个程序同时占用内存和磁盘，其增长空间就大大增加了。而且，分页之后，如果一个程序需要更多的空间，给其分配一个新页即可（而无需将程序倒出倒进从而提高空间增长效率）。

1.2 虚拟地址的构成与地址翻译

　　（1）虚拟地址的构成

　　在分页系统下，一个程序发出的虚拟地址由两部分组成：页面号和页内偏移值，如下图所示：

　　例如，对于32位寻址的系统，如果页面大小为4KB，则页面号占20位，页内偏移值占12位。

　　（2）地址翻译：虚拟地址→物理地址

　　分页系统的核心是页面的翻译，即从虚拟页面到物理页面的映射（Mapping）。该翻译过程如下伪代码所示：

if(虚拟页面非法、不在内存中或被保护)
{
    陷入到操作系统错误服务程序
}
else
{
    将虚拟页面号转换为物理页面号
    根据物理页面号产生最终物理地址
}

　　而这个翻译过程由内存管理单元（MMU）完成，MMU接收CPU发出的虚拟地址，将其翻译为物理地址后发送给内存。内存管理单元按照该物理地址进行相应访问后读出或写入相关数据，如下图所示：

　　那么，这个翻译是怎么实现的呢？答案是查页表，对于每个程序，内存管理单元MMU都为其保存一个页表，该页表中存放的是虚拟页面到物理页面的映射。每当为一个虚拟页面寻找到一个物理页面之后，就在页表里增加一条记录来保留该映射关系。当然，随着虚拟页面进出物理内存，页表的内容也会不断更新变化。

1.3 页表

　　页表的根本功能是提供从虚拟页面到物理页面的映射。因此，页表的记录条数与虚拟页面数相同。此外，内存管理单元依赖于页表来进行一切与页面有关的管理活动，这些活动包括判断某一页面号是否在内存里，页面是否受到保护，页面是否非法空间等等。

　　页表的一个记录所包括的内容如下图所示：

　　由于页表的特殊地位，决定了它是由硬件直接提供支持，即页表是一个硬件数据结构。

1.4 分页系统的优缺点

　　优点：

　　（1）分页系统不会产生外部碎片，一个进程占用的内存空间可以不是连续的，并且一个进程的虚拟页面在不需要的时候可以放在磁盘中。

　　（2）分页系统可以共享小的地址，即页面共享。只需要在对应给定页面的页表项里做一个相关的记录即可。

　　缺点：页表很大，占用了大量的内存空间。

1.5 缺页中断处理

　　在分页系统中，一个虚拟页面既有可能在物理内存，也有可能保存在磁盘上。如果CPU发出的虚拟地址对应的页面不在物理内存，就将产生一个缺页中断，而缺页中断服务程序负责将需要的虚拟页面找到并加载到内存。缺页中断的处理步骤如下，省略了中间很多的步骤，只保留最核心的几个步骤：

二、页面置换算法

　　如果发生了缺页中断，就需要从磁盘上将需要的页面调入内存。如果内存没有多余的空间，就需要在现有的页面中选择一个页面进行替换。使用不同的页面置换算法，页面更换的顺序也会各不相同。如果挑选的页面是之后很快又要被访问的页面，那么系统将很开再次产生缺页中断，因为磁盘访问速度远远内存访问速度，缺页中断的代价是非常大的。因此，挑选哪个页面进行置换不是随随便便的事情，而是有要求的。

2.1 页面置换的目标

　　页面置换时挑选页面的目标主要在于降低随后发生缺页中断的次数或概率。

　　因此，挑选的页面应当是随后相当长时间内不会被访问的页面，最好是再也不会被访问的页面。BTW，如果可能，最好选择一个没有修改过的页面，这样替换时就无须将被替换页面的内容写回磁盘，从而进一步加快缺页中断的响应速度。

　　所以，为了达到这个目的，先驱们设计出了各种各样的页面置换算法，下面就来看看这些算法。

2.2 随机更换算法

　　在需要替换页面的时候，产生一个随机页面号，从而替换与该页面号对应的物理页面。遗憾的是，随机选出的被替换的页面不太可能是随后相当长时间内不会被访问的页面。也就是说，这种算法难以保证最小化随后的缺页中断次数。事实上，这种算法的效果相当差。

2.3 先进先出算法

　　顾名思义，先进先出（FIFO，First In First Out）算法的核心是更换最早进入内存的页面，其实现机制是使用链表将所有在内存中的页面按照进入时间的早晚链接起来，然后每次置换链表头上的页面就行了，而新加进来的页面则挂在链表的末端，如下图所示：

　　FIFO的优点是简单且容易实现，缺点是如果最先加载进来的页面是经常被访问的页面，那么就可能造成被访问的页面替换到磁盘上，导致很快就需要再次发生缺页中断，从而降低效率。

2.4 第二次机会算法

　　由于FIFO只考虑进入内存的时间，不关心一个页面被访问的频率，从而有可能造成替换掉一个被经常访问的页面而造成效率低下。那么，可以对FIFO进行改进：在使用FIFO更换一个页面时，需要看一下该页面是否在最近被访问过，如果没有被访问过，则替换该页面。反之，如果最近被访问过（通过检查其访问位的取值），则不替换该页面，而是将该页面挂到链表末端，并将该页面进入内存的时间设置为当前时间，并将其访问位清零。这样，对于最近被访问过的页面来说，相当于给了它第二次机会。

　　例如，当A页面最近被访问过，即其访问位R的值为1，则使用第二次机会算法之后，链表的格局如下图所示：

　　第二次机会算法简单、公平且容易实现。但是，每次给予一个页面第二次机会时，将其移动到链表末端需要耗费时间。此外，页面的访问位只在页面替换进行扫描时才可能清零，所以其时间局域性体现得不好，访问位为1的页面可能是很久以前访问的，时间上的分辨粒度太粗，从而影响页面替换的效果。

2.5 时钟算法

　　为了改善第二次机会算法的缺点，先驱们提出了时钟算法。时钟算法的核心思想是：将页面排成一个时钟的形状，该时钟有一个针臂，每次需要更换页面时，我们从针臂所指的页面开始检查。如果当前页面的访问位为0，即从上次检查到这次，该页面没有被访问过，将该页面替换。反之，就将其访问位清零，并顺时针移动指针到下一个页面。重复这些步骤，直到找到一个访问位为0的页面。

　　例如下图所示的一个时钟，指针指向的页面是F，因此第一个被考虑替换的页面是F。如果页面F的访问位为0，F将被替换。如果F的访问位为1，则F的访问位清零，指针移动到页面G。

　　从表面上看，它和第二次机会算法类似，都是访问位为0就更换，反之则再给一次机会。但是，它和第二次机会算法还是有几点不同：

　　（1）他们的数据结构不一样，第二次机会使用的是链表，时钟算法使用的是索引（整数指针）。这样，其使用的内存空间不一样。

　　（2）第二次机会需要使用额外的内存，而时钟算法可以直接使用页表。使用页表的好处是无需额外的空间，更大的好处是页面的访问位会定期自动清零，这样将使得时钟算法的时间分辨粒度较第二次机会算法高，从而取得更好的页面替换效果。

　　时钟算法的精髓是第二次机会，其缺点也就和第二次机会算法一样：过于公平，没有考虑到不同页面调用频率的不同，有可能换出不应该或不能换出的页面，还可能造成无限循环。

PS：至此，随机、FIFO、第二次机会与时钟算法的介绍就到此结束，这四种算法都是属于“公平算法”，即所有的页面都或多或少地给予公平待遇，没有页面获得特殊待遇。但是这种公平实现方式，会使效率受到一定影响，这时因为个体对于整个系统的贡献没有被区别对待，造成贡献大的和贡献小的待遇一样，自然会影响整个系统的效率。

2.6 最优更换算法

　　我们知道，最理想的页面替换算法是选择一个再也不会被访问的页面进行替换。如果不存在这样的页面，那至少选择一个在随后最长时间内不会被访问的页面进行替换。这样，我们就可以保证在随后发生缺页中断的次数最小或概率最低，这种算法就是最有替换算法。

　　但是，我们没法知道一个页面随后多长时间不会被访问，因此最优更换算法在实际中没法实现，那么为什么要介绍最有更换算法呢？这是为了定义一个标杆，以此来评判其他算法的优劣。

2.7 NRU（最近未被使用）算法

　　顾名思义，NRU就是选择一个在最近一段时间内没有被访问过的页面进行替换，这是基于程序访问的时空局域性。因为根据时空局域性原理，一个最近没有被访问的页面，在随后的时间里也不太可能被访问，而NRU的实现方式就是利用页面的访问和修改位。

　　每个页面都有一个访问位和一个修改位，凡是对页面进行读写操作时，访问位被设置为1。当进程对页面进行读写操作时，修改位设置为1。根据这两个位的状态来对页面进行分类的话，可以分成以下四种页面类型：1、2、3、4。

　　有了这个分类，NRU算法就按照这四类页面的顺序依次寻找可以替换的页面。如果所有页面皆被访问和修改过，那也只能从中替换掉一个页面，因此NRU算法总是会终结的。

　　当然，这种分类比较笼统，在同一类页面里，我们没有办法分辨出哪一类被访问的时间更近一些。即在某些情况下，我们替换的可能并不是最近没有被使用的页面。

2.8 LRU（最近最少使用）算法

　　与NRU算法相比，LRU算法不仅考虑最近是否用过，还要考虑最近使用的频率。这里是基于过去的数据预测未来：如果一个页面被访问的频率低，那么以后很可能也用不到。

　　LRU算法的实现必须以某种方式记录每个页面被访问的次数，这是个相当大的工作量。最简单的方式就是在页表的记录项里增加一个计数域，一个页面被访问一次，这个计数器的值就增加1。于是，当需要更换页面时，只需要找到计数域值最小的页面替换即可，该页面即是最近最少使用的页面。另一种简单实现方式就是用一个链表将所有页面链接起来，最近被使用的页面在链表头，最近未被使用的放在链表尾。在每次页面访问时对这个链表进行更新，使其保持最近被使用的页面在链表头。

　　LRU算法虽然很好，但是实现成本高（需要分辨出不同页面中哪个页面时最近最少使用的），并且时间代价大（每次页面访问发生时都需要更新记录）。因此，一般的商业操作系统都没有采纳LRU页面更新算法。

2.9 工作集算法

　　由于不可能精确地确定那个页面是最近最少使用的，那就干脆不花费这个力气，只维持少量的信息使得我们选出的替换页面不太可能是马上又会使用的页面即可。这种少量的信息就是工作集信息。

　　工作集概念来源于程序访问的时空局限性，即在一段时间内，程序访问的页面将局限在一组页面集合上。例如，最近k次访问均发生在某m个页面上，那么m就是参数为k时的工作集。我们用w(k,t)来表示在时间t时k次访问所涉及的页面数量。

　　显然，随着k的增长，w(k,t)的值也随之增长；但是当k增长到某个数值之后，w(k,t)的值将增长极其缓慢甚至接近停滞，并维持一段时间的稳定，如下图所示：

　　由上图可以看出，如果一个程序在内存里面的页面数与其工作集大小相等或者超过工作集，则该程序可在一段时间内不会发生缺页中断。如果其在内存的页面数小于工作集，则发生缺页中断的频率将增加，甚至发生内存抖动。

　　因此，工作计算法的目标就是维持当前的工作集的页面在物理内存里面。每次页面更换时，寻找一个不属于当前工作集的页面替换即可。这样，我们再寻找页面时只需要将页面分离为两大类即可：当前工作集内页面和当前工作集外页面。如此，只要找到一个飞当前工作集的页面，将其替换即可。

　　工作集算法的优点：实现简单，只需要在页表的每个记录增加一个虚拟时间域即可。而且，这个时间域不是每次发生访问时都需要更新，而是在需要更换页面时，页面更换算法对其进行修改，因此时间成本也不大。

　　工作集算法的缺点：每次扫描页面进行替换时，有可能需要扫描整个页表。然而，并不是所有页面都内存里，因此扫描过程中的一大部分时间将是无用功。另外，由于其数据结构是线性的，会造成每次都按同样的顺序进行扫描，显得不太公平。

2.10 工作集时钟算法

　　鉴于工作集算法的缺点，先驱们将工作集算法与时钟算法结合起来，设计出了工作集时钟算法，即使用工作集算法的原理，但是将页面的扫描顺序按照时钟的形式组织起来。这样每次需要替换页面时，从指针指向的页面开始扫描，从而达到更加公平的状态。而且，按时钟组织的页面只是在内存里面的页面，在内存外的页面不放在时钟圈里，从而提高实现效率。

　　鉴于其时间与空间上的优势，工作集时钟算法被大多商业操作系统所采纳。

参考资料

邹恒明，《操作系统之哲学原理》，机械工业出版社

DecoratorMode

2019-03-31T08:26:40.000Z

java 装饰器模式

结构

模式结构

Component抽象构件角色：真实对象和装饰对象有相同的接口。这样，客户端对象就能够以与真实对象相同的方式同装饰对象交互。
ConcreteCompoent具体构建角色(真实对象)：定义一个将要接收附加责任的类。
Decorator装饰角色：持有一个抽象构件的引用。装饰对象接受所有客户端的请求，并把这些请求转发给真实的对象。这样，就能在真实对象调用前后增加新的功能。
ConcreteDecorate具体装饰角色：负责给构件对象增加新的功能。

代码结构：

代码

Person.java

Component抽象构件角色:

就是一个功能接口

package com.user;

public interface Person {
void eat();

}

Man.java

ConcreteCompoent具体构建角色(真实对象):

定义具体要被装饰的类（Man），这个类要实现上述接口（实现eat）

package com.user;

public class Man implements Person {

@Override
public void eat() {
// TODO Auto-generated method stub
System.out.println("男人在吃饭");
}

}

Decorator.java

Decorator装饰角色：

持有一个抽象构件的引用。装饰对象接受所有客户端的请求，并把这些请求转发给真实的对象。这样，就能在真实对象调用前后增加新的功能。

package com.user;

public abstract class Decorator implements Person {

Person person;   //  持有接口的引用    加不加protected 都行 如果为了安全还是加上好
public Decorator(Person person)   // 将原里的set函数改为构造函数
{
this.person = person;
}
@Override
public void eat() {
// TODO Auto-generated method stub
person.eat();
}

}

这个装饰器持有抽象接口（Person）的对象，并通过构造函数对它初始化，抽象装饰器也要实现步骤1中的抽象接口(Person),只不过抽象装饰器的实现方式比较特殊，它通过调用持有的抽象接口（Person）的对象的方法来实现抽象接口的功能函数。

那么算是一个接口的对象呢？具体来说就是实现了这个接口的所有类，都可以实例化出一个对象来作为接口的对象，比如 Man me = new Man(); 因为Man 实现了 Person接口所以me 就是一个接口（Person）对象，所以把me 传递到具体装饰角色DecoratorA（Person person）的构造函数里不会报错。

DecoratorA.java

ConcreteDecorate具体装饰角色：

负责给构件对象增加新的功能。

package com.user;

public class DecoratorA extends Decorator {  // 具体的装饰器    继承   抽象的装饰器

public DecoratorA(Person person) {
super(person);   // 调用父类构造函数的 this.person = person
}
public void Aeat(){
// eat 的包装新功能
System.out.println("Eat A Balabala");
}
@Override
public void eat(){
super.eat(); // 调用父类的eat()函数
Aeat();      // 执行Aeat()函数包装的新功能
}
}

DecoratorB.java

ConcreteDecorate具体装饰角色：

负责给构件对象增加新的功能。

package com.user;

public class DecoratorB extends Decorator { // 具体的装饰器    继承   抽象的装饰器
public DecoratorB(Person person) {
super(person);//调用父类构造函数的 this.person = person
}
public void eatB(){
// eat 的另一种包装新功能
System.out.println("eat B balabala");
}
@Override
public void eat(){
super.eat();
eatB();        // 执行eat另一种包装新功能
}

}

总结

装饰器步骤：

定义要被装饰的功能（eat）抽象接口（Person）
定义具体要被装饰的类（Man），这个类要实现上述接口（实现eat）
定义抽象装饰器（Decorator），这个装饰器持有步骤1中的抽象接口（Person）的对象，并通过构造函数对它初始化，抽象装饰器也要实现步骤1中的抽象接口(Person),只不过抽象装饰器的实现方式比较特殊，它通过调用持有的抽象接口（Person）的对象的方法来实现抽象接口的功能函数。什么算是一个接口的对象呢？具体来说就是实现了这个接口的所有类，都可以实例化出一个对象来作为接口的对象，比如 Man me = new Man(); 因为Man 实现了 Person接口所以me 就是一个接口（Person）对象，所以把me 传递到DecoratorA（Person person）的构造函数里不会报错~
定义具体装饰器（DecoratorA/B/C…），包装功能函数eat，在super的基础上添加新功能。

优缺点

优点

为类添加新的功能但是 Man这个类却不用改变，也不会产生新的继承类，类的数目会比较少
可以对一个对象进行多次装饰，创造出不同的表现

缺点

产生一堆装饰器对象比如这里的DecoratorA da、DecoratorB db稍微占用内存空间
装饰模式易出错，调试排查比较麻烦。

Algorithm1

2019-01-18T14:55:42.000Z

动态规划

第一小题

题目：

某工厂调查了解市场情况，估计在今后四个月内，市场对其产品的需求量如下表所示。

时期（月）	需要量（产品单位）
1	2
2	3
3	2
4	4

已知：对每个月来讲，生产一批产品的固定成本费为 3 (千元)，若不生产，则为零。每
生产单位产品的成本费为 1 （千元)。同时，在任何一个月内，生产能力所允许的最大生产
批量为不超过 6 个单位。
又知每单位产品的库存费用为每月 0.5 （千元），同时要求在第一个月开始之初，及
在第四个月末，均无产品库存。
问：在满足上述条件下，该厂应如何安排各个时期的生产与库存，使所花的总成本费用
最低？
要求：写出各种变量、状态转移方程、递推关系式、和详细计算步骤。

解：

如下图：

1
2

第二小题

题目：

某推销员要从城市 v1 出发，访问其它城市 v2，v3，…，v6 各一次且仅一次，

最后返回 v1。D为各城市间的距离矩阵。问：该推销员应如何选择路线，才能使总的行程最短？

节点v1,v2,…,v6之间的距离矩阵D如下

$$
D= \left[

\begin{matrix}
0 & 10 & 20 & 30 & 40 & 50 \
12 & 0 & 18 & 30 & 25 & 21 \
23 & 19 & 0 & 5 & 10 & 15 \
34& 32 & 4 & 0 & 8 & 16 \
45 & 27 & 11 & 10 & 0 & 18 \
56 & 22 & 16 & 20 & 12 & 0 \

\end{matrix}
\right] \tag{1}
$$

解:

令L(v,U) 表示从v出发遍历U中所有点一次仅一次后返回到原点v_1的最短路径长度，则有如下的递推公式
$$
L(v_i,U_i) =\min_{v_{i+1} \in U_i } { L(v_{i+1},U_i -{v_{i+1}}) +D[v_i] [v_{i+1}] } \tag{2}
$$
特别的
$$
L(v_i, \emptyset) = D[v_i][0] \tag{3}
$$
令函数
$$
min_len( v_i,U_i )
$$
实现 L的功能

min_len ()函数输入起始城市和要遍历城市的集合，返回最小长度,下一跳节点组成的元组(最小长度,下一跳节点)流程图如下：

主函数用于输出整个过程的路径和最小长度，流程如下：

答案输出：

最小路径长度： 80
路径为: V1 ->V2 ->V6 ->V5 ->V4 ->V3 ->V1

#!/usr/bin/env python
# encoding: utf-8
# 姓名：魏翔
# 学号：ZY1806220




dislist = [
    [0,10,20,30,40,50],
    [12,0,18,30,25,21],
    [23,19,0,5,10,15],
    [34,32,4,0,8,16],
    [45,27,11,10,0,18],
    [56,22,16,20,12,0]
]
U = set([0,1,2,3,4,5])

# 函数输入参数为：
# 起点v_i和待访问集合 u_i
# 函数返回：
# 以v_i为起点遍历u_i后返回原点v_1的最小路径长度 以及 下一跳节点编号
def min_len(v_i,u_i):
    if len(u_i)==0:              #  如果u_i集合为空则返回 （从v_i到v_0的长度，下一跳节点：0）
        return dislist[v_i][0],0 
    results = []
    for item in u_i:             #  遍历所有未访问过得节点，将他们作为下一跳
        temp = (min_len(item,u_i-{item})[0]+dislist[v_i][item],item) # 递推公式
        results.append(temp)
    result = min(results)        # 找到最小的路径长度和下一跳节点
    return result


if __name__ == "__main__":
    U=U-{0}
    print ("最小路径长度：",min_len(0,U)[0])  # 最短路径长度
    print("路径为:\n\nV1 -> ")
    index=0
    while len(U)!=0:                        # 循环打印路径索引（下一跳节点）
        result,index = min_len(index,U)
        print('V' + str(index+1)+' -> ')    # 路径索引加1 因为list索引下标是从0开始 而题目中的下标从1开始
        U.remove(index)

    print('V1')                             # 最后返回到v1节点

分支定界

问题描述

直接上代码

 //ZY1806220 魏翔
/*
 * @Description: Assignment 2
 * @Author: ZY1806220_魏翔
 * @Date: 2019-01-08 10:34:46
 * @LastEditTime: 2019-01-08 15:32:16
 * @LastEditors: Please set LastEditors
 */
#include
#include
#include
#define max_vexNum 50
#define MAX_INT 0x7FFFFFFF
using namespace std;

typedef struct{
    bool is_visited[max_vexNum];                //标记节点在当前深度(deep)下是否被访问过 
    int dist[max_vexNum][max_vexNum];           //记录距离的邻接矩阵
    int cost[max_vexNum][max_vexNum];           //记录花费的邻接矩阵
    int path[max_vexNum];                       //记录全局最小距离对应的访问路径
    int sumCost;                                //记录全局最小距离对应的cost总和
    int min_sumDist;                            //记录全局最小距离
}Graph;
int path[max_vexNum] = {0};

/**
 * @description: 深度优先遍历图，并按条件进行剪枝，最终找到满足条件的最短路径，并更新全局最小距离，保存路径轨迹
 * @param {Graph &G:待遍历的图的引用, int start_vex：当前起始节点, int dist：从0到当前节点已用距离, int cost：从0到当前节点已用花费, int deep：当前深度}   
 * @return: void
 */
void DFS(Graph &G,int start_vex,int dist,int cost,int deep)
{
    G.is_visited[start_vex]=true;   //当前节点访问过标志为真
    path[deep] = start_vex+1;       //当前路径当前深度下节点编号
    
    if (start_vex==max_vexNum-1) {            //找到满足条件的更短路径，更新全局最短路径
        /* code */
        G.min_sumDist = dist;
        G.sumCost = cost;
        for (int i=0; i
        {
            G.path[i]=0;
        }
        for (int i=0; i<=deep;i++)
        {
            G.path[i] = path[i];
        }
    }
    
    for(int i = 0; i < max_vexNum; i++)
    {
        /* code */
        if((G.dist[start_vex][i]>0) && (G.dist[start_vex][i]<9999) && (G.is_visited[i]==false))
        {
            int new_dist = dist+G.dist[start_vex][i];
            int new_cost = cost+G.cost[start_vex][i];
            if( (new_cost>1500) || (new_dist>G.min_sumDist)){       //满足剪枝条件
                continue;
                //这个剪枝的界还是不够紧凑
                //可以先通过Floyd求出每个节点到B的最短路径（路径下届）
                //求出每个节点到B的最小cost（花费下届）
                //如果 当前已有cost+从当前节点到B的最小cost>1500 || 
                //     当前已有路径长度+当前到B最短路径长>G.min_sumDist 
                //则剪枝
            }
            else{
                DFS(G,i,new_dist,new_cost,deep+1);
                G.is_visited[i]=false;
            }
        }
    }
    
}


/**
 * @description: 初始化图 
 * @param ：
 * Graph的引用 Graph &
 * @return: void
 */
void initial_Graph(Graph &G)
{
    ifstream in_dist;
    ifstream in_cost;
    in_dist.open("m1.txt");
    if(!in_dist.is_open()){
        cout<<"Open file m1.txt failure"<<endl;
    }
    in_cost.open("m2.txt");
    if(!in_cost.is_open()){
        cout<<"Open file m2.txt failure"<<endl;
    }
    for(int i=0; i
    {
        G.is_visited[i]=false;
        G.path[i]=0;
    }
    G.sumCost = 0;
    G.min_sumDist = MAX_INT;
    for(int i = 0; i < max_vexNum; i++)
    {
        /* code */
        for(int j =0; j
        {
            in_dist >> G.dist[i][j];
            in_cost >> G.cost[i][j];
        }
    }
}

/**
 * @description: 打印图G中的最小距离和其花费，以及最小距离对应的一个路径
 * @param {Graph &} 
 * @return: void
 */
void printGraph(Graph &G)
{
    printf("最小距离为:%d;\t其花费为:%d\n", G.min_sumDist, G.sumCost);
    for (int i = 0; G.path[i] != 0; i++)
    {
        if (i == 0) printf("路径:%d", G.path[i]);
        else printf("->%d", G.path[i]);
    }
}

int main(int argc, char const *argv[])
{
    Graph G;
    initial_Graph(G);
    DFS(G,0,0,0,0);
    printGraph(G);
    cout<<endl;
    system("pause");
    return 0;
}

Nanjing

2019-01-18T14:29:29.000Z

南京游记

一次不单纯的南京之旅，和一个有趣的女孩纸~

出发

北京to南京南

玄武湖&城墙

这么大的公园竟然不收门票~~~

冬天的树还绿着，但是看不到秋天的银杏大道了。。。

还有湖中央的小黄鸭

城墙上的刻字，是什么意思啊？？？

太阳快落山了，某人嘴里只有大连和南京才会有的夕阳~

打码打码，为数不多的未假笑的照片~

网红书店

认识你们后，感觉自己像个文盲一样，捂脸… 我主要是来拍照的哈哈哈~

南京博物馆 & 第一场雪

博大精深地下楼，诸多展馆吸眸球。

优良制作青铜鼎，完好存留独木舟。

古邑风流书冊籍，六朝迭兴载春秋。

辉煌历史人民创，催我挥毫盛世讴。

不知道写什么，引用一下提升下币格。

夜游南大

emmm假装满墙都是绿油油的~

中山陵

历史书上的三民主义？

妈耶，恐高恐高~

夫子庙

晚上来会更好看？

我才不要路过呢，我要陪你度过漫长的岁月，嘻嘻嘻~

火锅&跨年

热乎乎美滋滋的火锅，风格和菜品巨像东来顺的力来顺~

超级假，没有倒计时的跨年。晚上看《求婚大作战》的时候也看到了跨年，

“和同伴们一起度过的重要时间是无价的”。

风筝和她

谜一样的定价，只有在门口的湖边才能放飞自我的小风筝~

背影，悄咪咪的喜欢一下~~~

南京站

差点哭晕的南京站…

还有二刷南京大学呦~

充满着”喜悦“、”期待“、“冲动”的二刷~

Hadoop Day 3

2018-08-19T02:31:31.000Z

读取数据部分的关系图

InputFormat

首先我们先看看官方文档对 InputFormat的解释

从api文档中我们可以了解到InputFormat主要干3件事:

验证作业输入的正确性，如格式等
将输入文件切割成逻辑分片(InputSplit)，一个InputSplit将会被分配给一个独立的Map任务
提供RecordReader实现，读取InputSplit中的”K-V对”供Mapper使用

基于文件的InputFormats（通常是FileInputFormat的子类）的默认行为是根据输入文件的总大小（以字节为单位）将输入拆分为逻辑InputSplits。但是，输入文件的FileSystem块大小被视为输入拆分大小的上限。可以通过mapreduce.input.file.inputformat.split.minsize设置拆分大小的下限。

显然，基于输入大小的逻辑分割对于许多应用来说是不够的，因为要尊守记录边界。在这种情况下，应用程序还必须实现一个RecordReader，负责尊守记录边界，并将逻辑InputSplit的面向记录的视图呈现给单个任务。

方法：

List getSplits(): 获取由输入文件计算出输入分片(InputSplit)，解决数据或文件分割成片问题。
RecordReader createRecordReader(): 创建RecordReader，从InputSplit中读取数据，解决读取分片中数据问题

TextInputFormat: 输入文件中的每一行就是一个记录，Key是这一行的byte offset，而value是这一行的内容

KeyValueTextInputFormat: 输入文件中每一行就是一个记录，第一个分隔符字符切分每行。在分隔符字符之前的内容为Key，在之后的为Value。分隔符变量通过key.value.separator.in.input.line变量设置，默认为(\t)字符。

NLineInputFormat: 与TextInputFormat一样，但每个数据块必须保证有且只有Ｎ行，mapred.line.input.format.linespermap属性，默认为１

SequenceFileInputFormat: 一个用来读取字符流数据的InputFormat，为用户自定义的。字符流数据是Hadoop自定义的压缩的二进制数据格式。它用来优化从一个MapReduce任务的输出到另一个MapReduce任务的输入之间的数据传输过程。

FileInputFormat

/** 
 * A base class for file-based {@link InputFormat}s.
 * 
 * FileInputFormat is the base class for all file-based 
 * InputFormats. This provides a generic implementation of
 * {@link #getSplits(JobContext)}.
 * Subclasses of FileInputFormat can also override the 
 * {@link #isSplitable(JobContext, Path)} method to ensure input-files are
 * not split-up and are processed as a whole by {@link Mapper}s.
 */
@InterfaceAudience.Public
@InterfaceStability.Stable
public abstract class FileInputFormat<K, V> extends InputFormat<K, V> {
  public static final String INPUT_DIR = 
    "mapreduce.input.fileinputformat.inputdir";                 //输入路径配置名称
  public static final String SPLIT_MAXSIZE = 
    "mapreduce.input.fileinputformat.split.maxsize";            // split大小的最大值配置名称
  public static final String SPLIT_MINSIZE = 
    "mapreduce.input.fileinputformat.split.minsize";            //split大小的最小值配置名称
  public static final String PATHFILTER_CLASS = 
    "mapreduce.input.pathFilter.class";
  public static final String NUM_INPUT_FILES =
    "mapreduce.input.fileinputformat.numinputfiles";
  public static final String INPUT_DIR_RECURSIVE =
    "mapreduce.input.fileinputformat.input.dir.recursive";       //是否递归dir的boolean的配置名称
  public static final String LIST_STATUS_NUM_THREADS = 
    "mapreduce.input.fileinputformat.list-status.num-threads";    //收集filestatus的list时候的线程数目配置名称
  public static final int DEFAULT_LIST_STATUS_NUM_THREADS = 1;    // 默认使用一个线程来做list filestatus

  private static final Log LOG = LogFactory.getLog(FileInputFormat.class);

  private static final double SPLIT_SLOP = 1.1;   // 10% slop     //当文件大小少于SPLIT_SLOP*SPLIT_SIZE时不分割
  
  @Deprecated
  public static enum Counter { 
    BYTES_READ
  }
  ...
}

类的主要成员变量都是一些配置名称的String。下面我们从这个类的主要函数说起。

在List listStatus(JobContext job)中列出了输入的目录列表。子类可以对这个方法重载例如子类可以满足特定正则表达式的输入路径。

@param job the job to list input paths for
@return array of FileStatus objects
@throws IOException if zero items.

listStatus函数通过JobContext来获取配置信息，通过读取配置信息进行判断来进一步建立InputFile的PathFilter，如果配置中numThreads==1则使用singleThreadedListStatus()函数来的到List，否则建立LocatedFileStatusFetcher对象，多线程地得到List。

protected List listStatus(JobContext job
                                      ) throws IOException {
  Path[] dirs = getInputPaths(job);
  if (dirs.length == 0) {
    throw new IOException("No input paths specified in job");
  }
  
  // get tokens for all the required FileSystems..
  TokenCache.obtainTokensForNamenodes(job.getCredentials(), dirs, 
                                      job.getConfiguration());

  // Whether we need to recursive look into the directory structure
  boolean recursive = getInputDirRecursive(job);

  // creates a MultiPathFilter with the hiddenFileFilter and the
  // user provided one (if any).
  List filters = new ArrayList();
  filters.add(hiddenFileFilter);
  PathFilter jobFilter = getInputPathFilter(job);
  if (jobFilter != null) {
    filters.add(jobFilter);
  }
  PathFilter inputFilter = new MultiPathFilter(filters);
  
  List result = null;

  int numThreads = job.getConfiguration().getInt(LIST_STATUS_NUM_THREADS,
      DEFAULT_LIST_STATUS_NUM_THREADS);        //读取配置文件中的线程数
  Stopwatch sw = new Stopwatch().start();
  if (numThreads == 1) {
    result = singleThreadedListStatus(job, dirs, inputFilter, recursive); //单线程执行ListStatus
  } else {
    Iterable locatedFiles = null;
    try {
      LocatedFileStatusFetcher locatedFileStatusFetcher = new LocatedFileStatusFetcher(
          job.getConfiguration(), dirs, recursive, inputFilter, true);     // 多线程建立LocatedFileStatusFetcher 来多线程执行listfilestatus，在fetcher中通过 Executors.newFixedThreadPool()建立线程池
      locatedFiles = locatedFileStatusFetcher.getFileStatuses();
    } catch (InterruptedException e) {
      throw new IOException("Interrupted while getting file statuses");
    }
    result = Lists.newArrayList(locatedFiles);
  }
  
  sw.stop();
  if (LOG.isDebugEnabled()) {
    LOG.debug("Time taken to get FileStatuses: " + sw.elapsedMillis());
  }
  LOG.info("Total input paths to process : " + result.size()); 
  return result;
}

getSplits() 用于将输入文件进行拆分成splits并返回

Generate the list of files and make them into FileSplits.
@param job the job context
@throws IOException

通过配置文件来得到split的maxSize和minSize和filesystem的BlockSize，通过以上三个size可以算出 Math.max(minSize, Math.min(maxSize, blockSize))=splitsize。通过上面的listStatus()来得到List并且变量list中的每一个FileStatus，按照每一个file的长度和splitsize来分片成splits

public List getSplits(JobContext job) throws IOException {
   Stopwatch sw = new Stopwatch().start();
   long minSize = Math.max(getFormatMinSplitSize(), getMinSplitSize(job));
   long maxSize = getMaxSplitSize(job);

   // generate splits
   List splits = new ArrayList();
   List files = listStatus(job);
   for (FileStatus file: files) {
     Path path = file.getPath();
     long length = file.getLen();
     if (length != 0) {
       BlockLocation[] blkLocations;
       // 得到blkLocations 要么通过LocatedFileStatus的getBlockLocation 
       // 要么通过FileSystem的getFileBlockLocations
       if (file instanceof LocatedFileStatus) {
         blkLocations = ((LocatedFileStatus) file).getBlockLocations();
       } else {
         FileSystem fs = path.getFileSystem(job.getConfiguration());
         blkLocations = fs.getFileBlockLocations(file, 0, length);
       }
       if (isSplitable(job, path)) {
         long blockSize = file.getBlockSize();
         long splitSize = computeSplitSize(blockSize, minSize, maxSize);

         long bytesRemaining = length;
         // 对当前文件按照splitsize进行分割，分割成一个个split
         while (((double) bytesRemaining)/splitSize > SPLIT_SLOP) {
           int blkIndex = getBlockIndex(blkLocations, length-bytesRemaining);  //得到block的index
           splits.add(makeSplit(path, length-bytesRemaining, splitSize,
                       blkLocations[blkIndex].getHosts(),
                       blkLocations[blkIndex].getCachedHosts()));
           bytesRemaining -= splitSize;
         }

         if (bytesRemaining != 0) {
           int blkIndex = getBlockIndex(blkLocations, length-bytesRemaining);
           splits.add(makeSplit(path, length-bytesRemaining, bytesRemaining,
                      blkLocations[blkIndex].getHosts(),
                      blkLocations[blkIndex].getCachedHosts()));
         }
       } else { // not splitable 不可分 整个文件作为split
         splits.add(makeSplit(path, 0, length, blkLocations[0].getHosts(),
                     blkLocations[0].getCachedHosts()));
       }
     } else { 
       //Create empty hosts array for zero length files
       splits.add(makeSplit(path, 0, length, new String[0]));
     }
   }
   // Save the number of input files for metrics/loadgen
   job.getConfiguration().setLong(NUM_INPUT_FILES, files.size());
   sw.stop();
   if (LOG.isDebugEnabled()) {
     LOG.debug("Total # of splits generated by getSplits: " + splits.size()
         + ", TimeTaken: " + sw.elapsedMillis());
   }
   return splits;
 }

制作切片split

 /*
 * 制作切片split，makeSplit调用FileSplit()函数来制作切片
 */
protected FileSplit makeSplit(Path file, long start, long length, 
                               String[] hosts, String[] inMemoryHosts) {
   return new FileSplit(file, start, length, hosts, inMemoryHosts);
 }

对file进行切片，并附带cached-blocks信息

 /** Constructs a split with host and cached-blocks information
 *
 * @param file the file name
 * @param start the position of the first byte in the file to process
 * @param length the number of bytes in the file to process
 * @param hosts the list of hosts containing the block
 * @param inMemoryHosts the list of hosts containing the block in memory
 */
public FileSplit(Path file, long start, long length, String[] hosts,
    String[] inMemoryHosts) {
  this(file, start, length, hosts);
  hostInfos = new SplitLocationInfo[hosts.length];
  for (int i = 0; i < hosts.length; i++) {
    // because N will be tiny, scanning is probably faster than a HashSet
    boolean inMemory = false;
    for (String inMemoryHost : inMemoryHosts) {
      if (inMemoryHost.equals(hosts[i])) {
        inMemory = true;
        break;
      }
    }
    hostInfos[i] = new SplitLocationInfo(hosts[i], inMemory);
  }
}

LineRecorder: 负责记录行的读取情况

param Configuration, job configuartion.
param FileSplit, split to read.
param byte[], delimiter bytes.

通过job的configuration获取文件系统fs并且以输入流的形式打开分片所在的文件，后续的逻辑是判断输入流输入的文件是否为压缩，如果是压缩的话解压后重新定位start和end。如果不是压缩的的话很简单，直接通过读取split的start和end作为LineRecordReader的start和end，并且将文件定位到分片的start处。在以上逻辑完成后判断当前分片是不是文件中的第一个分片(start==0?)如果不是的话则越过第一行。
为什么非开头的分片要越过第一行？这是由于按照blocksize大小读取的分片很可能不是按行对其的，而LineRecorderReader要处理的是行保证行对齐是关键，通过忽略非开头分片的第一行可以做到行对其，其结果如下图所示

那么如何计算对于非开头分片应该忽略多少才能保证行对其，即计算非开头分片start的后移量是多少呢？主要是通过readLine()函数,该还函数返回到行末的偏移量。后续分析。

public LineRecordReader(Configuration job, FileSplit split,
    byte[] recordDelimiter) throws IOException {
  this.maxLineLength = job.getInt(org.apache.hadoop.mapreduce.lib.input.
    LineRecordReader.MAX_LINE_LENGTH, Integer.MAX_VALUE);
  start = split.getStart();
  end = start + split.getLength();
  final Path file = split.getPath();
  compressionCodecs = new CompressionCodecFactory(job);
  codec = compressionCodecs.getCodec(file);

  // open the file and seek to the start of the split
  final FileSystem fs = file.getFileSystem(job);
  fileIn = fs.open(file);
  if (isCompressedInput()) {
    decompressor = CodecPool.getDecompressor(codec);
    if (codec instanceof SplittableCompressionCodec) {
      final SplitCompressionInputStream cIn =
        ((SplittableCompressionCodec)codec).createInputStream(
          fileIn, decompressor, start, end,
          SplittableCompressionCodec.READ_MODE.BYBLOCK);
      in = new CompressedSplitLineReader(cIn, job, recordDelimiter);
      start = cIn.getAdjustedStart();
      end = cIn.getAdjustedEnd();
      filePosition = cIn; // take pos from compressed stream
    } else {
      in = new SplitLineReader(codec.createInputStream(fileIn,
          decompressor), job, recordDelimiter);
      filePosition = fileIn;
    }
  } else {
    fileIn.seek(start);
    in = new UncompressedSplitLineReader(
        fileIn, job, recordDelimiter, split.getLength());
    filePosition = fileIn;
  }
  // If this is not the first split, we always throw away first record
  // because we always (except the last split) read one extra line in
  // next() method.
  if (start != 0) {              // 如果不是文件中的第一个分片
    start += in.readLine(new Text(), 0, maxBytesToConsume(start));    //忽略文件中的第一行 start后移。这里调用了readLine来计算后移的偏量
  }
  this.pos = start;
}

接下来我们看看readLine函数,它主要通过判断是否设定分隔符来返回自定义和默认方式的readline。

public int readLine(Text str, int maxLineLength,
                    int maxBytesToConsume) throws IOException {
  if (this.recordDelimiterBytes != null) {     //分隔符数组为空？ 即未设定分隔符？
    return readCustomLine(str, maxLineLength, maxBytesToConsume);  //自定义分隔符！
  } else {                                     
    return readDefaultLine(str, maxLineLength, maxBytesToConsume); //否则使用默认的分隔符 即 '\r' or '\n'
  }
}

HBase

2018-08-08T01:57:10.000Z

Hbase安装

准备环境

Hadoop 集群安装配置
ZooKeeper 3.4.X 安装和配置
Hbase 下载解压修改配置文件散发到集群

Hadoop集群安装配置参见

ZooKeeper 3.4.X 安装与配置

zookeeper有单机、伪分布式集群、完全分布式集群三种部署方式,本文中主要讲解完全分布集群的配置方法，其他两种参见

完全分布式集群中假设我们有三台主机h1 h2 h3, 下载ZooKeeper 3.4.X

tar -xzfv zookeeper-3.4.x.tar.gz -C '安装目录'
mkdir -p '预设zookeeper的data目录'(/home/weixiang/data/zookeeper/)
mkdir -p '预设zookeeper的logs目录'(/home/weixiang/logs/zookeeper/)
cd '安装目录/ZooKeeper 3.4.X/conf'

将zookeeper添加到环境变量中,编辑/etc/profile文件添加export ZOOKEEPER_HOME=安装目录/zookeeper-3.4.x
export PATH=......:$ZOOKEEPER_HOME/bin

修改zoo_sample.cfg 重命名为zoo.cfg 并开始编辑

tickTime=2000
dataDir=对应预设zookeeper的data目录(/home/weixiang/data/zookeeper/)
dataLogDir=对应预设zookeeper的logs目录(/home/weixiang/logs/zookeeper/)
clientPort=2181
initLimit=5
syncLimit=2
server.1=h1:2888:3888
server.2=h2:2888:3888
server.3=h3:2888:3888

通过scp -r “源目录” “目的主机目录” 命令将zookeeper 3.4.X 文件夹整个拷贝到其他节点
在每个节点的预设zookeeper的data目录(/home/weixiang/data/zookeeper/)上建立myid文件并写入节点编号(这个编号对应配置文件中的server.X其中的X) 例如在h2 这个节点myid的内容应为2

运行脚本启动,停止,查看状态
在每个安装zookeeper的节点上启动zkServer.sh start

查看状态zkServer.sh status 可以得到以下结果:
[hadoop@mdw ~]$ zkServer.sh status
JMX enabled by default
Using config: ……/../conf/zoo.cfg
Mode: follower/leader

在每个安装zookeeper的节点上停止zookeeper服务zkServer.sh stop

如果出错查看zookeeper.out错误信息

Hbase的安装与配置

已在h1 h2 h3 h4 h5上安装好了hadoop: h1 为namenode h2-5 为datanode
已在h1 h2 h3上安装好了zookeeper
将在h1 h2 h3 上装hbase 并将h1 作为master和regionserver，h2-3作regionserver

首先要确定hadoop,Hbase,JDK版本兼容的问题,根据兼容表格选取合适的版本

在本文中我们选取的是hbase 1.3.2.1 下载链接

在h1节点下载,下载后通过 tar -xzvf hbase-1.3.2.1-bin.tar.gz -C '安装目录(例如 /usr/)' 来解压。解压后编辑/usr/hbase-1.3.2.1/conf目录下的hbase-env.sh文件添加如下内容

export JAVA_HOME=/usr/java/jdk1.8.0_172
export HBASE_LOG_DIR=/usr/hbase-1.3.2.1/logs     #日志路径 如果路径不存在先建立路径
export HBASE_MANAGES_ZK=false                    #表示hbase不用内部的zookeeper 
export HBASE_CLASSPATH=/usr/hadoop-2.6.5/etc/hadoop #hadoop配置文件所在位置

编辑hbase-site.xml 文件如下

<configuration>
<property> 
<name>hbase.rootdirname> 
<value>hdfs://h1:9000/hbasevalue> 
property> 
<property> 
<name>hbase.cluster.distributedname> 
<value>truevalue> 
property> 
<property> 
<name>hbase.zookeeper.quorumname> 
<value>h1,h2,h3value> 
property> 
<property> 
<name>hbase.zookeeper.property.dataDirname> 
<value>/home/weixiang/data/zookeepervalue> 
property> 
<property> 
<name>hbase.mastername> 
<value>hdfs://h1:60000value> 
property>  
configuration>

以上配置文件涉及zookeeper的要与已经装好的zookeeper信息相符合,涉及到hadooop的也要与已装的hadoop相符。

编辑regionservers文件,将regionservers的主机名添加到文件中

h1

h2

h3

最后在建立hdfs-site.xml 软连接到hadoop的hdfs-site.xml配置文件ln -s hdfs-site.xml /usr/hadoop-2.6.5/etc/hadoop/hdfs-site.xml
效果如下

lrwxrwxrwx. 1 weixiang weixiang 42 Aug 7 18:00 hdfs-site.xml -> /usr/hadoop-2.6.5/etc/hadoop/hdfs-site.xml

至此hbase配置完成通过scp -r命令将hbase文件夹复制到各个节点的安装目录
在各个节点将hbase添加到环境变量中,编辑/etc/profile文件添加
export HBASE_HOME=安装目录/hbase-1.3.2.1
export PATH=......:$HBASE_HOME/bin

Hbase 的启动和相关脚本说明

脚本使用小结：

开启集群，start-hbase.sh
关闭集群，stop-hbase.sh
开启/关闭所有的regionserver、zookeeper，hbase-daemons.sh start/stop regionserver/zookeeper
开启/关闭单个regionserver、zookeeper，hbase-daemon.sh start/stop regionserver/zookeeper
开启/关闭master hbase-daemon.sh start/stop master, 是否成为active master取决于当前是否有active master
两个进阶脚本
rolling-restart.sh 可以用来挨个滚动重启
graceful_stop.sh move服务器上的所有region后，再stop/restart该服务器，可以用来进行版本的热升级

几个细节：

hbase-daemon.sh start master 与 hbase-daemon.sh start master –backup，这2个命令的作用一样的，是否成为backup或active是由master的内部逻辑来控制的
stop-hbase.sh 不会调用hbase-daemons.sh stop regionserver 来关闭regionserver，但是会调用hbase-daemons.sh stop zookeeper/master-backup来关闭zk和backup master，关闭regionserver实际调用的是hbaseAdmin的shutdown接口
通过$HBASE_HOME/bin/hbase stop master关闭的是整个集群而非单个master，只关闭单个master的话使用$HBASE_HOME/bin/hbase-daemon.sh stop master
$HBASE_HOME/bin/hbase stop regionserver/zookeeper 不能这么调，调了也会出错，也没有路径会调用这个命令，但是可以通过$HBASE_HOME/bin/hbase start regionserver/zookeeper 来启动rs或者zk，hbase-daemon.sh调用的就是这个命令

常用到的HBase启动脚本有：

$HBASE_HOME/bin/start-hbase.sh
启动整个集群
$HBASE_HOME/bin/stop-hbase.sh
停止整个集群
$HBASE_HOME/bin/hbase-daemons.sh
启动或停止，所有的regionserver或zookeeper或backup-master
$HBASE_HOME/bin/hbase-daemon.sh
启动或停止，单个master或regionserver或zookeeper

以start-hbase.sh为起点，可以看看脚本间的一些调用关系

start-hbase.sh的流程如下：

运行hbase-config.sh（作用后面解释）
解析参数（0.96版本及以后才可以带唯一参数autorestart，作用就是重启）
调用hbase-daemon.sh来启动master；调用hbase-daemons.sh来启动regionserver zookeeper master-backup

hbase-config.sh的作用：

装载相关配置，如HBASE_HOME目录，conf目录，regionserver机器列表，JAVA_HOME目录等，它会调用$HBASE_HOME/conf/hbase-env.sh

hbase-env.sh的作用：

主要是配置JVM及其GC参数，还可以配置log目录及参数，配置是否需要hbase管理ZK，配置进程id目录等

hbase-daemons.sh的作用：

根据需要启动的进程，
如为zookeeper,则调用zookeepers.sh
如为regionserver，则调用regionservers.sh
如为master-backup，则调用master-backup.sh

zookeepers.sh的作用：

如果hbase-env.sh中的HBASE_MANAGES_ZK” = “true”，那么通过ZKServerTool这个类解析xml配置文件，获取ZK节点列表（即hbase.zookeeper.quorum的配置值），然后通过SSH向这些节点发送远程命令：

cd ${HBASE_HOME};
$bin/hbase-daemon.sh –config ${HBASE_CONF_DIR} start/stop zookeeper

regionservers.sh的作用：

与zookeepers.sh类似，通过${HBASE_CONF_DIR}/regionservers配置文件，获取regionserver机器列表，然后SSH向这些机器发送远程命令：
cd ${HBASE_HOME};
$bin/hbase-daemon.sh –config ${HBASE_CONF_DIR} start/stop regionserver

hbase-daemon.sh的作用：

无论是zookeepers.sh还是regionservers.sh或是master-backup.sh，最终都会调用本地的hbase-daemon.sh，其执行过程如下：

运行hbase-config.sh，装载各种配置（java环境、log配置、进程ID目录等）
如果是start命令？滚动out输出文件，滚动gc日志文件，日志文件中输出启动时间+ulimit -a信息，如“Mon Nov 26 10:31:42 CST 2012 Starting master on dwxx.yy.taobao””..open files (-n) 65536..”
调用$HBASE_HOME/bin/hbase start master/regionserver/zookeeper
执行wait，等待3中开启的进程结束
执行cleanZNode，将regionserver在zk上登记的节点删除，这样做的目的是：在regionserver进程意外退出的情况下，可以免去3分钟的ZK心跳超时等待，直接由master进行宕机恢复
如果是stop命令？
根据进程ID，检查进程是否存在；调用kill命令，然后等待到进程不存在为止
如果是restart命令？
调用stop后，再调用start

Hbase简介

HBase是一个分布式的、面向列的开源数据库，该技术来源于Chang et al所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。
就像Bigtable利用了Google文件系统（File System）所提供的分布式数据存储一样，HBase在Hadoop之上提供了类似于Bigtable的能力，并利用hdfs文件系统作为后端存储
HBase是Apache的Hadoop 项目的子项目。
HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库.另一个不同的是HBase基于列的而不是基于行的模式

Hbase 逻辑模型

以表的形式存放数据
表由行与列组成，每个列属于某个列族，由行和列确定的存储单元称为元素
每个元素保存了同一份数据的多个版本，由时间戳来标识区分

行建：行键可以是最大长度不超过64KB的任意字符串，并按照字典序存储
对于经常要一起读取的行，要对行键值精心设计，以便它们能放在一起存储

行键是数据行在表里的唯一标识，并作为检索记录的主键
访问表里的行只有三种方式
1.通过单个行键访问
2.给定行键的范围访问
3.全表扫描

列族与列：

列表示为<列族>:<限定符>
Hbase在磁盘上按照列族存储数据，这种列式数据库的设计非常适合于数据分析的情形
列族里的元素最好具有相同的读写方式（例如等长的字符串），以提高性能
在创建表的时候要指定列族的数目，但是列族中限定符的数目（即列的数目）可以不定

时间戳：

对应每次数据操作的时间，可由系统自动生成，也可以由用户显式的赋值
Hbase支持两种数据版本回收方式：1 每个数据单元，只存储指定个数的最新版本 2 保存指定时间长度的版本（例如7天）
常见的客户端时间查询：“某个时刻起的最新数据”或“给我全部版本的数据”
元素由行键，列族:限定符，时间戳唯一决定
元素以字节码形式存放，没有类型之分

Hbase 物理模型

物理结构说明：
由于Hbase后端存储采用HDFS，HDFS中很难对文件进行修改操作，即使是最基本的追加append操作也是很难实现的，因此Hbase在修改数据时实际上是插入一个新时间戳的记录，并且Hbase在删除时所做的操作只是打上删除标签，当storefile文件合并的时候再剔除删除项和时间戳过期的记录。

Region与RegionServer:

表在行方向上，按照行键范围划分成若干的Region
每个表最初只有一个region，当记录数增加到超过某个阈值时，开始分裂成两个region
物理上所有数据存放在HDFS，由Region服务器提供region的管理
一台物理节点只能跑一个HRegionServer
一个Hregionserver可以管理多个表的Region实例
一个Region实例包括Hlog日志和存放数据的Store
Hmaster作为总控节点
Zookeeper负责调度

HLog：

用于灾难恢复（掉电、物理介质损坏等）
预写式日志，记录所有更新操作，操作先记录进日志，数据才会写入

-ROOT- 和 .META. 表：

HBase中有两张特殊的Table，-ROOT-和.META.
.META.：记录了用户表的Region信息分布情况，.META.本身可以分布在多个regoin
-ROOT-：记录了.META.表的Region信息，-ROOT-只有一个region
Zookeeper中记录了-ROOT-表的location

Memstore与storefile：

一个region由多个store组成，每个store包含一个列族的所有数据，这也是为什么Hbase是列式数据库
Store包括位于把内存的memstore和位于硬盘的storefile
写操作先写入memstore，当memstore中的数据量达到某个阈值，Hregionserver会启动flashcache进程写入storefile，每次写入形成单独一个storefile
当storefile文件的数量增长到一定阈值后，系统会进行合并，在合并过程中会进行版本合并和删除工作，形成更大的storefile
当storefile大小超过一定阈值后，会把当前的region分割为两个，并由Hmaster分配到相应的region服务器，实现负载均衡
客户端检索数据时，先在memstore找，找不到再找storefile

Key-Value format:

在Hbase中会建立B+树作为索引，B+ tree的叶子节点就是形如上图的key-value,而索引节点现实按照Key中的Row建立索引再逐层按照其他属性如列族(column family)进行索引。因此相同列族的记录会在同一个子树下。
物理模型图解：

比较

Hbase vs Oracle:

索引不同造成行为的差异
Hbase适合大量插入同时又有读的情况
Hbase的瓶颈是硬盘传输速度，Oracle的瓶颈是硬盘寻道时间,因为Hbase所有操作都可以看作是插入操作而且是大批量的，因此速度取决于与硬盘的传输速度。但是oracle经常要随机读写，update时先找到修改内容对应block装载到内存，修改再回写到硬盘。
Hbase很适合寻找按照时间排序top n的场景
Hbase不能复杂的统计适合做简单的key-value查询

参考文章:

1: https://spaces-x.github.io/2018/07/26/hadoop-d-2/#Hadoop%E9%9B%86%E7%BE%A4%E9%83%A8%E7%BD%B2
2: https://www.cnblogs.com/lsdb/p/7297731.html
3: https://blog.csdn.net/gnail_oug/article/details/46981607
4: https://www.w3cschool.cn/hbase_doc/
5: https://hbase.apache.org/book.html
6: http://zjushch.iteye.com/blog/1736065

Git

2018-08-01T12:14:00.000Z

git 简介

Git是什么？

Git是目前世界上最先进的分布式版本控制系统（没有之一）。

那什么是版本控制系统？
如果你用Microsoft Word写过长篇大论，那你一定有这样的经历:
想删除一个段落，又怕将来想恢复找不回来怎么办？有办法，先把当前文件“另存为……”一个新的Word文件，再接着改，改到一定程度，再“另存为……”一个新文件，这样一直改下去，最后你的Word文档变成了这样：

过了一周，你想找回被删除的文字，但是已经记不清删除前保存在哪个文件里了，只好一个一个文件去找，真麻烦。

看着一堆乱七八糟的文件，想保留最新的一个，然后把其他的删掉，又怕哪天会用上，还不敢删，真郁闷。

更要命的是，有些部分需要你的财务同事帮助填写，于是你把文件Copy到U盘里给她（也可能通过Email发送一份给她），然后，你继续修改Word文件。一天后，同事再把Word文件传给你，此时，你必须想想，发给她之后到你收到她的文件期间，你作了哪些改动，得把你的改动和她的部分合并，真困难。

于是你想，如果有一个软件，不但能自动帮我记录每次文件的改动，还可以让同事协作编辑，这样就不用自己管理一堆类似的文件了，也不需要把文件传来传去。如果想查看某次改动，只需要在软件里瞄一眼就可以，岂不是很方便？

这个软件用起来就应该像这个样子，能记录每次文件的改动：

版本	文件名	用户	说明	日期
1	service.doc	张三	删除了软件服务条款5	7/12 10:38
2	service.doc	张三	增加了License人数限制	7/12 18:09
3	service.doc	李四	财务部门调整了合同金额	7/13 9:51
4	service.doc	张三	延长了免费升级周期	7/14 15:17

Git工作原理

工作区（Working Directory）

工作区就是电脑上的一个目录，一般就是项目所在的目录。

版本库（Repository）

工作区有一个隐藏目录.git，这个不算工作区，而是Git的版本库。
Git的版本库里存了很多东西，其中最重要的就是称为stage（或者叫index）的暂存区，还有Git为我们自动创建的第一个分支master，以及指向master的一个指针叫HEAD。
第一步是用git add把文件添加进去，实际上就是把文件修改添加到暂存区；
第二步是用git commit提交更改，实际上就是把暂存区的所有内容提交到当前分支。

git 常用命令及作用

任何人在使用git之前，都要提交简单的个人信息，以便git区分不同的提交者身份。
git config –global user.name “your name”
git config –global user.email yourname@example.com
想新开启一个项目，应该先建立一个目录，然后所有的项目开发内容都在此目录下进行。
cd workdir
git init //产生.git文件夹
git add . //将目录下的所有文件都加入到暂存(index)区
git commit -m "提交信息" //将当前的暂存(index)区提交到版本库的Head所指向的分支
git commit -a //这是一个偷懒的命令，相当于git add .; git commit; 但是不会将新建立的文件add进去只管修改过的已存在的文件
查看修改
git diff --cached //查看index file和仓库之间代码的区别的
git diff //如果省略–cached选项的话，就是比较working tree和index file(暂存区)的区别
git status //这个命令在git commit之前有效，表示都有哪些文件发生了改动
查看日志
git log //查看commit简要日志

git log -p //会输出非常详细的日志内容，包括了每次都做了哪些源码的修改

只显示了部分详细信息
git show $commit_id //显示某个提交提与上一个提交相比的详细信息包括改了哪里

显示某个分支的详细信息
git show 分支名

git show HEAD^ //查看HEAD的父母的信息
git show HEAD^^ //查看HEAD的父母的父母的信息
git show HEAD~4 //查看HEAD上溯4代的信息
分支
git branch //显示当前都有哪些分支，其中标注*为当前所在分支
git branch experimental //创建一个试验分支，名称叫experimental
git checkout experimental //转移到experimental分支
如果分支开发成功：修改代码
git commit -a //在experimental分支改进完代码之后用commit在此分支中进行提交
git checkout master //转移回master分支
git merge experimental //经证实分支开发成功，将exerimental分支合并到主分支

如果冲突需要人为修改冲突的部分,修改后

git commit -a //彻底完成此次分支合并，即提交master分支
如果合并后没问题可以将experimental分支删除
git branch -d experimental //因为experimental分支已提交，所以可安全删除此
如果分支开发失败：
git checkout master
git branch -D experimental //由于分支被证明失败，因此使用-D来放弃并删除该分支
图形化界面
gitk
在5中gitk的效果

gitk –since=”2 weeks ago” drivers/ 将在GUI中显示自2周前到现在为止的且位于drivers目录下的分支记录信息
拉取
我如果非常非常信任bob的开发能力：
git pull /home/bob/myrepo
pull命令的意思是从远端git仓库中取出然后合并(git-merge)到我（rocrocket）的项目中去。git-pull命令有可能会因为/home/bob的目录权限问题而被拒绝，解决方法是chmod o+rx /home/bob
如果我不是很信任bob的开发能力：
git fetch /home/bob/myrepo master:bobworks
此命令意思是提取出bob修改的代码内容，然后放到我（rocrocket）工作目录下的bobworks分支中。之所以要放到分支中，而不是master中，就是要我先仔仔细细看看bob的开发成果，如果我觉得满意，我再merge到master中，如果不满意，我完全可以直接git branch -D掉。
git whatchanged -p master..bobworks //用来查看bob都做了什么
git checkout master //切换到master分区
git pull . bobworks //如果我检查了bob的工作后很满意，就可以用pull来将bobworks分支合并到我的项目中了
git branch -D bobworks //如果我检查了bob的工作后很不满意，就可以用-D来放弃这个分支就可以了
过了几天，bob如果想继续帮助我开发，他需要先同步一下我这几天的工作成果，只要在其当初clone的myrepo目录下执行git pull即可：
git pull //不用加任何参数，因为当初clone的时候，git已经记住了我（rocrocket）的工作目录，它会直接找到我的目录来取。
远端库
git 不仅可以保存在本地还可以上传到远端的github库,为了方便上传我们首先配置ssh传输密钥
为本地git库添加远端库
git remote add origin 远端库路径(例如git@github.com:spaces-X/paper_version.git)
从本地push到远端库
git push origin 源(本地)分支:目的(远端库)分支

在上图中我们可以看到本地HEAD->master比远端的origin->master先进了一个版本采用上述命令来同步远端库
从远端库拉取到本地
git fetch origin 源(远端)分支:目的(本地)分支
git checkout master //切换到本地master分支上
git merge 分支 //合并分支到master
Tag与搜索
git tag V3 $commit_id 以后可以用V3来代替复杂的名称commit_id

可以用git grep帮助我们搜索：
git grep “print” V3 //在V3中搜索所有的包含print的行
git grep “print” //在所有的历史记录中搜索包含print的行
git log V3..V7 //显示V3之后直至V7的所有历史记录
git log –since=”2 weeks ago” //显示2周前到现在的所有历史记录。具体语法可查询git-ref-parse命令的帮助文件。

Hadoop Day 2

2018-07-26T05:15:46.000Z

[TOC]

Hadoop集群部署

Hadoop 部署中需要以下几个主要步骤

创建虚拟机Centos7并复制2个虚拟机副本
为虚拟机配置NAT端口转发方便ssh
修改hosts文件并配置相互间免密ssh
安装jdk8和hadoop，并修改配置文件
启动hadoop

eclips + hadoop2.6.5 开发环境配置

所需的软件：

eclipse的配置方法参见“Windows下使用Eclipse工具搭建Hadoop2.6.4开发环境”

可能遇到的错误的解决方案

log4j.rootLogger=debug,stdout,R  
log4j.appender.stdout=org.apache.log4j.ConsoleAppender  
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout  
log4j.appender.stdout.layout.ConversionPattern=%5p - %m%n  
log4j.appender.R=org.apache.log4j.RollingFileAppender  
log4j.appender.R.File=mapreduce_test.log  
log4j.appender.R.MaxFileSize=1MB  
log4j.appender.R.MaxBackupIndex=1  
log4j.appender.R.layout=org.apache.log4j.PatternLayout  
log4j.appender.R.layout.ConversionPattern=%p %t %c - %m%  
log4j.logger.com.codefutures=DEBUG

Hadoop家族

Pig
Zookeeper
Hbase
Hive
Sqoop
Avro
Chukwa
Cassandra

Pig

Hadoop客户端
使用类似于SQL的面向数据流的语言Pig Latin
Pig Latin可以完成排序，过滤，求和，聚组，关联等操作，可以支持自定义函数
Pig自动把Pig Latin映射为Map-Reduce作业上传到集群运行，减少用户编写Java程序的苦恼
三种运行方式：Grunt shell，脚本方式，嵌入式

Hbase

Google Bigtable的开源实现
列式数据库
可集群化
可以使用shell、web、api等多种方式访问
适合高读写（insert）的场景
HQL查询语言
NoSQL的典型代表产品

Hive

数据仓库工具。可以把Hadoop下的原始结构化数据变成Hive中的表
数据仓库工具。可以把Hadoop下的原始结构化数据变成Hive中的表
支持一种与SQL几乎完全相同的语言HiveQL。除了不支持更新、索引和事务，几乎SQL的其它特征都能支持
可以看成是从SQL到Map-Reduce的映射器
提供shell、JDBC/ODBC、Thrift、Web等接口

Zookeeper

Google Chubby的开源实现
用于协调分布式系统上的各种服务。例如确认消息是否准确到达，防止单点失效，处理负载均衡等
应用场景：Hbase，实现Namenode自动切换
工作原理：领导者，跟随者以及选举过程

Sqoop

用于在Hadoop和关系型数据库之间交换数据
通过JDBC接口连入关系型数据库

Avro

数据序列化工具，由Hadoop的创始人Doug Cutting主持开发
用于支持大批量数据交换的应用。支持二进制序列化方式，可以便捷，快速地处理大量数据
动态语言友好，Avro提供的机制使动态语言可以方便地处理 Avro数据。
Thrift接口

Chukwa

架构在Hadoop之上的数据采集与分析框架
主要进行日志采集和分析
通过安装在收集节点的“代理”采集最原始的日志数据
代理将数据发给收集器
收集器定时将数据写入Hadoop集群
指定定时启动的Map-Reduce作业队数据进行加工处理和分析
Hadoop基础管理中心（HICC）最终展示数据

Cassandra

NoSQL，分布式的Key-Value型数据库，由Facebook贡献
与Hbase类似，也是借鉴Google Bigtable的思想体系
只有顺序写，没有随机写的设计，满足高负荷情形的性能需求

hadoop 实例运行

代码：

example 1 word count:
/**
 * Licensed to the Apache Software Foundation (ASF) under one
 * or more contributor license agreements.  See the NOTICE file
 * distributed with this work for additional information
 * regarding copyright ownership.  The ASF licenses this file
 * to you under the Apache License, Version 2.0 (the
 * "License"); you may not use this file except in compliance
 * with the License.  You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */
package org.apache.hadoop.examples;

import java.io.IOException;
import java.util.StringTokenizer;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;

public class WordCount {

  public static class TokenizerMapper                         //继承Mapper类实现map方法
       extends Mapper<Object, Text, Text, IntWritable>{
    
    private final static IntWritable one = new IntWritable(1);
    private Text word = new Text();
      
    public void map(Object key, Text value, Context context
                    ) throws IOException, InterruptedException {
      StringTokenizer itr = new StringTokenizer(value.toString());
      while (itr.hasMoreTokens()) {
        word.set(itr.nextToken());
        context.write(word, one);
      }
    }
  }
    
  public static class IntSumReducer                           //继承并Reducer类并实现reduce方法
       extends Reducer<Text,IntWritable,Text,IntWritable> {  
    private IntWritable result = new IntWritable();

    public void reduce(Text key, Iterable values, 
                       Context context
                       ) throws IOException, InterruptedException {
      int sum = 0;
      for (IntWritable val : values) {
        sum += val.get();
      }
      result.set(sum);
      context.write(key, result);
    }
  }

  public static void main(String[] args) throws Exception {
    Configuration conf = new Configuration();
    String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();
    if (otherArgs.length < 2) {
      System.err.println("Usage: wordcount  [...] ");
      System.exit(2);
    }
    Job job = new Job(conf, "word count");
    job.setJarByClass(WordCount.class);
    job.setMapperClass(TokenizerMapper.class);
    job.setCombinerClass(IntSumReducer.class);
    job.setReducerClass(IntSumReducer.class);
    job.setOutputKeyClass(Text.class);
    job.setOutputValueClass(IntWritable.class);
    for (int i = 0; i < otherArgs.length - 1; ++i) {
      FileInputFormat.addInputPath(job, new Path(otherArgs[i]));
    }
    FileOutputFormat.setOutputPath(job,
      new Path(otherArgs[otherArgs.length - 1]));
    System.exit(job.waitForCompletion(true) ? 0 : 1);
  }
}

example 2 :对电话清单进行整理
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.util.StringTokenizer;
import javax.sound.midi.SysexMessage;


//import javax.tools.Tool;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.TextOutputFormat;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
import org.apache.hadoop.util.ToolRunner;

import com.sun.org.apache.xml.internal.serialize.OutputFormat;

public class Test_2 extends Configured implements Tool{
    enum Counter
    {
        LINESKIP, //出错的行数
    }
    public static class Map extends Mapper<LongWritable, Text, Text, Text>{
        @Override
        public void map(LongWritable key, Text value,
                Mapper.Context context)
                throws IOException, InterruptedException{
            // TODO Auto-generated method stub
            try {
                String line = value.toString();
                String[] linesplit = line.split(" ");
                String anum = linesplit[0];
                String bnum = linesplit[1];
                context.write(new Text(bnum), new Text(anum));
            } catch (java.lang.ArrayIndexOutOfBoundsException e) {
                // TODO: handle exception
                context.getCounter(Counter.LINESKIP).increment(1);
                return;
            }       
        }
    }
    public static class Reduce extends Reducer<Text, Text, Text, Text>{
        public void reduce(Text key,Iterable values,Context context) throws IOException, InterruptedException
        {
            String valueString;
            String out="";
            for (Text value:values) {
                valueString = value.toString();
                out += valueString+"|"; 
            }
            context.write(key, new Text(out));
        }
    }
    
    public int run(String[] args) throws Exception {
        Configuration conf = getConf();
        Job job = new Job(conf, "Test_2");
        job.setJarByClass(Test_2.class);
        for (int i = 0; i < args.length-1; i++) {
            FileInputFormat.setInputPaths(job, new Path(args[i]));
        }
        FileOutputFormat.setOutputPath(job, new Path(args[args.length-1]));
        job.setMapperClass(Map.class);
        job.setReducerClass(Reduce.class);
//      job.setOutputFormatClass(TextOutputFormat.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(Text.class);
        job.waitForCompletion(true);
        return job.isSuccessful()?0:1;
    };
    public static void main(String[] args) throws Exception {
        System.out.println(args.length);
        int res = ToolRunner.run(new Configuration(),new Test_2(),args);
        System.exit(res);
    }
}

GFW

2018-07-21T07:36:31.000Z

常规的 http 或者是 https 请求被墙(假设它没有被墙)的网站

首先你在浏览器里面键入 google.com, 然后回车
浏览器发起 DNS 请求获取 google.com 的 IP 地址(因为TCP连接必须要ip地址, 域名只是为了让人好记忆而发明出来的), DNS 服务器查询 google.com 的 IP 地址, 然后返回给浏览器.
浏览器拿到了 google.com 的IP地址, 然后向这个 IP 地址发起 TCP 连接, 三次握手之后连接成功.
然后到了 HTTP 协议的时间了, 浏览器向 google 的服务器发送 HTTP 请求头(因为此时 TCP 连接已经建立, 可以发送数据了), 请求头其实就是一段字符串.
1
2
3
4
5
6
GET / HTTP/1.1
Host: www.google.com
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.6)
Gecko/20050225 Firefox/1.0.1
Connection: Keep-Alive
...
无论是 HTTP 请求还是加密的 HTTPS 请求, 请求头都是不会被加密的.
google.com 收到请求头, 如果是 HTTPS 请求, 还要交换秘钥什么的, 这个就不解释了, 总之就是 google.com 把数据返回回来了.

在上述过程中墙的作用

我们键入 google.com 的时候浏览器需要先发起 DNS 请求查询 google.com 的 IP 地址, 如果拿不到这个 IP 地址, 不就无法和 google.com 的真实 IP 地址通讯了吗, 所以墙的初期手段就是污染 DNS, AI, 浏览器任你发送 DNS 请求, 国内的 DNS 服务器就给你返回一个错误的 IP 地址, 什么冰岛的,什么澳大利亚的地址给你, 去访问吧, 浏览器很懵, 有可能这个 IP 地址压根就没有被绑定服务器, 然后服务器不可达. 但是 DNS 请求需要我们的浏览器发起, 既然 DNS 请求能被污染, 如果我自己知道正确的 google.com IP地址, 我来告诉浏览器正确的 IP 地址不就行了吗, 刚开始想要科学上网的人确实是这么做的, 在 window 系统 C:\Windows\System32\drivers\etc 该目录下面有一个 hosts 文件, Mac 系统下面的为 /etc/hosts, 如果操作系统能在这里获得关于域名的 IP 地址, 就不会向 DNS服务器发起请求了, 所以都赶忙去找 google.com 的真实 IP 地址填在这里来让操作系统不要去其他的 DNS 查询了. 这个时期应该是成功的度过了一段时间吧, 当然我没有经历过, 我想科学上网的时候 google.com 的 IP 地址已经被封了🧐.忘了一件事情, 因为 DNS 服务器在公网上面有很多, 而且都是免费的, 出名的 8.8.8.8 就是谷歌提供的, 你可以自己填写自己的操作系统的 DNS 地址, 应该有一段时期可以把 DNS 服务器修改为 8.8.8.8, 谷歌并不会返回错误的地址, 所以后来 8.8.8.8 也被墙了👽.
墙继续升级, 既然你们能搞到真实的 google.com 的 IP 地址, 那我就把所有已知的 google.com 的 IP 地址全部封了, 但是 google.com 的服务器是可以换 IP 地址的, 你可以试一下, 多访问几次 google.com, 有可能是不相同的, 所以只是把已知的 google.com 服务器的 IP 地址封掉并不能完全的阻挡, 所以墙从 HTTP 协议入手了, HTTP 协议请求头的发送全部是明文的, 无论是 HTTP, 还是 HTTPS, 请求头全部都是明文的, 请求头里面有 google.com, 这就很尴尬了, 这个域名没有办法隐藏, 墙很开心, 好了, 所有经过我这里的数据包都要被拆开看看你访问的地址是不是违禁地址, 如果是的就不要继续了, 墙会模拟 google.com 的服务器给你的电脑发送一个 RST TCP响应, 电脑的TCP协议看到这个响应就会无条件的重置连接, 所以你会看到有时候你能拿到正确的 google.com 的IP地址, 也会看到浏览器提示你连接被重置, 这时候的 RST 的响应可是墙发给你的, 是不是感觉很荣耀😀, 然后墙还会模仿客户端给 google.com 的服务器发送 RST 响应, google.com 以为是你发的, 也会无条件的关闭 TCP 连接

SS如何穿墙

有一个代理协议叫做socks5, 可以帮助你穿透防火墙, 由socks5负责传递双方的数据
shadowsocks 把 socks5 拆成了两个部分

client ——-> ssclient ——> ssserver ———> server

client 把数据传递给 ssclient, 这就是你为什么要把 socks5 客户端的地址要填写 ssclient 监听的地址, ssclient 把数据加密, 包括 DNS 请求什么的一切数据全部加密发送给 ssserver(并且 ss 没有握手阶段, 没有明显的数据特征能辨识这个是 ss 流量), ssserver 把数据解密拿到 client 想要访问的域名, 然后发起 DNS 请求获取 IP 地址(这也就是为什么你的 VPS 要放在国外的原因), 然后和这个 IP 地址握手, 然后服务器响应, ssserver 并不负责处理数据, 只是原样把数据加密回传给 ssclient, ssclient 解密数据然后传递给浏览器, 浏览器负责数据的辨识处理(因为 HTTPS 还需要进一步的握手).

服务器的购买以及shadowsocks配置

购买服务器
上面的连接包含搬瓦工的一键配置ss，但是这个自带的太low了好多加密模式它都没有这就造成容易被墙ip 采用下面的连接配置ss 或 ssr

配置shadowsocks server
这个教程中的脚本将各种shadowsocks的版本都集成好了，具体在安装的时候选择即可

加密模式的选择与shadowsocks客户端配置

Hadoop Day 1

2018-07-16T10:36:01.000Z

Hadoop起源:

Google的低成本之道:

不使用超算，不使用存储（淘宝的去i，去e，去o之路）
大量使用普通的pc服务器，提供有冗余的集群服务
全世界多个数据中心，有些附带发电厂
运营商（中国联通电信）向Google倒付费

可以把Hadoop理解成是一个山寨版的Google，它是基于Google的三篇论文（解决上图中的问题）提出，具体如下：

GFS(Google File System)
PageRank
Bigtable

其中GFS 是HDFS的雏形；Bigtable是HBase的雏形

而PageRank主要是解决如何量化一个网页的价值问题，google通过建立数学模型来量化网页的价值进而在搜索结果中排序(后面会讲),但是由于该数学模型涉及到百万数量级的矩阵乘法运算，这在世界范围内都找不到能够在秒级单位的Response Time，因此对模型的求解引发了Map-Reduce分布式处理的思想，也就有了Hadoop中Map-Reduced的由来。

倒排索引：

Google 搜索的数据量相当大，按照常人的思维，google搜索应该是全数据库检索，但是这就不符合Google 毫秒级的响应时间。这里google借助了倒排索引，顾名思义，所谓倒排索引就是于正常相反，不是由记录来确定属性值，而是由属性值来确定记录的位置，因而称为倒排索引。
举个简单的例子以英文为例，下面是被索引的数据：

T₀: “it is what it is”
T₁: “what is it”
T₂: “it is a banana”

通过分词我们可以得到如下的反向索引

“a”: {2}
“banana”: {2}
“is”: {0, 1, 2}
“it”: {0, 1, 2}
“what”: {0, 1}

搜索 “what is it” 就变成求关键字的交集即
$${ 0,1 } \cap { 0,1,2 } \cap {0,1,2} = {0,1}$$

PageRank:

PageRank 是用来量化不同网页的价值的，它主要采用不同网页外连接到本网页的多少来量化，其实和期刊的影响因子计算类似，如果其他网页外链到本网页的数目也多，也就是本网页被其他网页引用次数越多，那么本网页的PageRank则高。

PageRank的具体算法如下

最后图中 q为所求的pagerank的解 q是矩阵G特征值为1的特征向量，求解可以通过随机初始化q^cur 不断迭代最后收敛。

网络基础之TCP连接建立分析

2018-07-16T03:43:32.000Z

问题描述：

在JAVA的client和server，使用socket通信，server使用NIO。

1.间歇性得出现client向server建立连接三次握手已经完成，但server的selector没有响应到这连接。
2.出问题的时间点，会同时有很多连接出现这个问题。
3.selector没有销毁重建，一直用的都是一个。
4.程序刚启动的时候必会出现一些，之后会间歇性出现。

正常的TCP建立连接三次握手的过程：

第一步：client 发送 syn 到server 发起握手；
第二步：server 收到 syn后回复syn+ack给client；
第三步：client 收到syn+ack后，回复server一个ack表示收到了server的syn+ack（此时client的56911端口的连接已经是established）

从问题的描述来看，有点像TCP建连接的时候全连接队列（accept队列，后面具体讲）满了，尤其是症状2、4. 为了证明是这个原因，马上通过 netstat -s | egrep “listen” 去看队列的溢出统计数据：

反复看了几次之后发现这个overflowed 数目一直在增加，那么可以明确的是server上全连接队列一定溢出了。
接着查看溢出后，OS怎么处理：

tcp_abort_on_overflow 为0表示如果三次握手第三步的时候全连接队列满了那么server扔掉client 发过来的ack（在server端认为连接还没建立起来）

为了证明客户端应用代码的异常跟全连接队列满有关系，我先把tcp_abort_on_overflow修改成 1，1表示第三步的时候如果全连接队列满了，server发送一个reset包给client，表示废掉这个握手过程和这个连接（本来在server端这个连接就还没建立起来）。

接着测试，这时在客户端异常中可以看到很多connection reset by peer的错误，到此证明客户端错误是这个原因导致的（逻辑严谨、快速证明问题的关键点所在）。

于是开发同学翻看java 源代码发现socket 默认的backlog（这个值控制全连接队列的大小，后面再详述）是50，于是改大重新跑，经过12个小时以上的压测，这个错误一次都没出现了，同时观察到 overflowed 也不再增加了。

到此问题解决，简单来说TCP三次握手后有个accept队列，进到这个队列才能从Listen变成accept，默认backlog 值是50，很容易就满了。满了之后握手第三步的时候server就忽略了client发过来的ack包（隔一段时间server重发握手第二步的syn+ack包给client），如果这个连接一直排不上队就异常了。

但是不能只是满足问题的解决，而是要去复盘解决过程，中间涉及到了哪些知识点是我所缺失或者理解不到位的；这个问题除了上面的异常信息表现出来之外，还有没有更明确地指征来查看和确认这个问题。

深入理解TCP握手过程中建连接的流程和队列

如上图所示，这里有两个队列：syns queue(半连接队列）；accept queue（全连接队列）。

三次握手中，在第一步server收到client的syn后，把这个连接信息放到半连接队列中，同时回复syn+ack给client（第二步）；

第三步的时候server收到client的ack，如果这时全连接队列没满，那么从半连接队列拿出这个连接的信息放入到全连接队列中，否则按tcp_abort_on_overflow指示的执行。

这时如果全连接队列满了并且tcp_abort_on_overflow是0的话，server过一段时间再次发送syn+ack给client（也就是重新走握手的第二步），如果client超时等待比较短，client就很容易异常了。

在我们的os中retry 第二步的默认次数是2（centos默认是5次）：

如果TCP连接队列溢出，有哪些指标可以看呢？

上述解决过程有点绕，听起来懵，那么下次再出现类似问题有什么更快更明确的手段来确认这个问题呢？（通过具体的、感性的东西来强化我们对知识点的理解和吸收。）

netstat -s

比如上面看到的 667399 times ，表示全连接队列溢出的次数，隔几秒钟执行下，如果这个数字一直在增加的话肯定全连接队列偶尔满了。

ss 命令

上面看到的第二列Send-Q 值是50，表示第三列的listen端口上的全连接队列最大为50，第一列Recv-Q为全连接队列当前使用了多少。

全连接队列的大小取决于：min(backlog, somaxconn) . backlog是在socket创建的时候传入的，somaxconn是一个os级别的系统参数。

这个时候可以跟我们的代码建立联系了，比如Java创建ServerSocket的时候会让你传入backlog的值：

半连接队列的大小取决于：max(64, /proc/sys/net/ipv4/tcp_max_syn_backlog)，不同版本的os会有些差异。

我们写代码的时候从来没有想过这个backlog或者说大多时候就没给他值（那么默认就是50），直接忽视了他，首先这是一个知识点的盲点；其次也许哪天你在哪篇文章中看到了这个参数，当时有点印象，但是过一阵子就忘了，这是知识之间没有建立连接，不是体系化的。但是如果你跟我一样首先经历了这个问题的痛苦，然后在压力和痛苦的驱动自己去找为什么，同时能够把为什么从代码层推理理解到OS层，那么这个知识点你才算是比较好地掌握了，也会成为你的知识体系在TCP或者性能方面成长自我生长的一个有力抓手。

netstat 命令

netstat跟ss命令一样也能看到Send-Q、Recv-Q这些状态信息，不过如果这个连接不是Listen状态的话，Recv-Q就是指收到的数据还在缓存中，还没被进程读取，这个值就是还没被进程读取的 bytes；而 Send 则是发送队列中没有被远程主机确认的 bytes 数。

netstat -tn 看到的 Recv-Q 跟全连接半连接没有关系，这里特意拿出来说一下是因为容易跟 ss -lnt 的 Recv-Q 搞混淆，顺便建立知识体系，巩固相关知识点。

比如如下netstat -t 看到的Recv-Q有大量数据堆积，那么一般是CPU处理不过来导致的：

上面是通过一些具体的工具、指标来认识全连接队列（工程效率的手段）。

实践验证一下上面的理解

把java中backlog改成10（越小越容易溢出），继续跑压力，这个时候client又开始报异常了，然后在server上通过 ss 命令观察到：

按照前面的理解，这个时候我们能看到3306这个端口上的服务全连接队列最大是10，但是现在有11个在队列中和等待进队列的，肯定有一个连接进不去队列要overflow掉，同时也确实能看到overflow的值在不断地增大。

Tomcat和Nginx中的Accept队列参数

Tomcat默认短连接，backlog（Tomcat里面的术语是Accept count）Ali-tomcat默认是200, Apache Tomcat默认100。

Nginx默认是511

因为Nginx是多进程模式，所以看到了多个8085，也就是多个进程都监听同一个端口以尽量避免上下文切换来提升性能

总结

全连接队列、半连接队列溢出这种问题很容易被忽视，但是又很关键，特别是对于一些短连接应用（比如Nginx、PHP，当然他们也是支持长连接的）更容易爆发。一旦溢出，从cpu、线程状态看起来都比较正常，但是压力上不去，在client看来rt也比较高（rt=网络+排队+真正服务时间），但是从server日志记录的真正服务时间来看rt又很短。

jdk、netty等一些框架默认backlog比较小，可能有些情况下导致性能上不去。

希望通过本文能够帮大家理解TCP连接过程中的半连接队列和全连接队列的概念、原理和作用，更关键的是有哪些指标可以明确看到这些问题（工程效率帮助强化对理论的理解）。

另外每个具体问题都是最好学习的机会，光看书理解肯定是不够深刻的，请珍惜每个具体问题，碰到后能够把来龙去脉弄清楚，每个问题都是你对具体知识点通关的好机会。

参考文章:

http://www.cnxct.com/something-about-phpfpm-s-backlog/
http://veithen.github.io/2014/01/01/how-tcp-backlog-works-in-linux.html
http://www.cnblogs.com/zengkefu/p/5606696.html
http://www.cnxct.com/something-about-phpfpm-s-backlog/
http://jaseywang.me/2014/07/20/tcp-queue-%E7%9A%84%E4%B8%80%E4%BA%9B%E9%97%AE%E9%A2%98/
http://jin-yang.github.io/blog/network-synack-queue.html#
http://blog.chinaunix.net/uid-20662820-id-4154399.html

Welcome

2018-07-15T11:37:35.000Z

欢迎来到Space-X，本空间是基于hexo搭建的静态博客空间，主要用于日常生活、学习的经验分享

学习

Learning is hard.

我的GitHub

Coursera 公开课

生活

Life is simple.

生活中最悠闲莫非看我最爱的哔哩哔哩
豆瓣读书电影

日剧

Unnatural

讲述了在“非自然死亡原因研究所”任职的法医三澄美琴和同事们一起探查非正常死亡者的真正死因，从而帮助人们的故事，
其中也影射了社会显示出来的一些问题。个人得很好看。
每次Lemon这首歌一想起来，几乎都在泪目。也有许多喜欢的和值得思考的话。

毕业

Forever 1413
非常幸运遇到你们~